Исходники CuBLAS/CuFFT

Программирующим на CUDA может быть интересно: NVidia начала раздавать исходники библиотек CUBLAS/CUFFT.

Я, правда, не очень понимаю статус этого дела:

  • С одной стороны, все выложено на девелоперском сайте, куда нужна регистрация (и говорят, что стоит большая очередь желающих оной регистрации, хотя меня в прошлом году зарегистрировали за один день).
  • С другой стороны, в девелоперской рассылке пришли ссылки на незапароленый сайт, бери кто хочет.
Посему, ссылки не публикую, если кому-то нужно и нет терпения ждать (со временем все попадает в полностью открытый доступ, всегда так было) - пишите лично.

А вот что точно открыто всем желающим, так это визуальный профайлер (beta) для той же CUDA. Пока не смотрел, руки не дошли.

Comments

а что насчет атишного терафлопа?

Ну так он должен появиться в Q1 2008.

Подозреваю, что еще не появился.

Кстати, откуда терафлоп ? FireStream 9170 (который объявлен в ноябре,
но вроде пока не продается) - 500 гигафлопов

http://ati.amd.com/products/streamprocessor/specs.html

видимо имеется в виду HD3870 (RV680)?

Только с двумя гигами памяти и с обещанием арифметики в double.
Может и спец-чип (а может в 680 double есть, я в ATI не разбираюсь).

а что, два гига -- это плохо?
и у них еще X2 вроде есть, сдвоенная.

Два гига - это отлично.

А со сдвоенными картами я не понимаю базовых вещей: память же не общая ?

не знаю, там еще про crossfire упоминают

вроде при работе в SLI в CUDA память становится виртуально общая. а физически она конечно не общая, более того, на X2 3870 шина на каждый GPU только 256 бит и карта не поддерживает PCI-E 2.0, т.е. много времени будет уходить на обмен с основной памятью.

Что-то я пугаюсь.
Чтобы оно было виртуально общим и при этом еще и работало, там же нужно очень многое доделать. Когерентность кэшей (текстурных), например.

Я, натурально, не пробовал, а знающие люди <a href=http://alextutubalin.livejournal.com/53430.html?thread=118966>выражаются вполне конкретно</a>

ещё у них на форуме постили исходники другого SGEMM-а, который раза в полтора быстрее чем в CUBLAS :)

Ну да, я помню.

Но интересно разобраться в разнице в подходах. Пока я буквально 5 секунд смотрел и увидел, что данные хранятся в текстурах. Спорный подход.

да да,насчет ати поподробнее плиз