Исходники CuBLAS/CuFFT

lexa - 02/Фев/2008 21:14

Программирующим на CUDA может быть интересно: NVidia начала раздавать исходники библиотек CUBLAS/CUFFT.

Я, правда, не очень понимаю статус этого дела:

С одной стороны, все выложено на девелоперском сайте, куда нужна регистрация (и говорят, что стоит большая очередь желающих оной регистрации, хотя меня в прошлом году зарегистрировали за один день).
С другой стороны, в девелоперской рассылке пришли ссылки на незапароленый сайт, бери кто хочет.

Посему, ссылки не публикую, если кому-то нужно и нет терпения ждать (со временем все попадает в полностью открытый доступ, всегда так было) - пишите лично.

А вот что точно открыто всем желающим, так это визуальный профайлер (beta) для той же CUDA. Пока не смотрел, руки не дошли.

Comments

а что насчет атишного терафлопа?

_slw (not verified) - 02/Фев/2008 15:57

а что насчет атишного терафлопа?

Ну так он должен появиться в Q1 2008. Подозреваю, что еще н

lexa - 02/Фев/2008 16:03

Ну так он должен появиться в Q1 2008.

Подозреваю, что еще не появился.

Кстати, откуда терафлоп ? FireStream 9170 (который объявлен

lexa - 03/Фев/2008 05:45

Кстати, откуда терафлоп ? FireStream 9170 (который объявлен в ноябре,
но вроде пока не продается) - 500 гигафлопов

http://ati.amd.com/products/streamprocessor/specs.html

видимо имеется в виду HD3870 (RV680)?

_slw (not verified) - 03/Фев/2008 07:52

видимо имеется в виду HD3870 (RV680)?

Только с двумя гигами памяти и с обещанием арифметики в doub

lexa - 03/Фев/2008 09:38

Только с двумя гигами памяти и с обещанием арифметики в double.
Может и спец-чип (а может в 680 double есть, я в ATI не разбираюсь).

а что, два гига -- это плохо? и у них еще X2 вроде есть, сдв

_slw (not verified) - 03/Фев/2008 10:00

а что, два гига -- это плохо?
и у них еще X2 вроде есть, сдвоенная.

Два гига - это отлично. А со сдвоенными картами я не понима

lexa - 03/Фев/2008 10:09

Два гига - это отлично.

А со сдвоенными картами я не понимаю базовых вещей: память же не общая ?

не знаю, там еще про crossfire упоминают

_slw (not verified) - 03/Фев/2008 11:38

не знаю, там еще про crossfire упоминают

вроде при работе в SLI в CUDA память становится виртуально о

mrshurik (not verified) - 03/Фев/2008 12:00

вроде при работе в SLI в CUDA память становится виртуально общая. а физически она конечно не общая, более того, на X2 3870 шина на каждый GPU только 256 бит и карта не поддерживает PCI-E 2.0, т.е. много времени будет уходить на обмен с основной памятью.

Что-то я пугаюсь. Чтобы оно было виртуально общим и при этом

lexa - 03/Фев/2008 12:19

Что-то я пугаюсь.
Чтобы оно было виртуально общим и при этом еще и работало, там же нужно очень многое доделать. Когерентность кэшей (текстурных), например.

Я, натурально, не пробовал, а знающие люди <a href=http://alextutubalin.livejournal.com/53430.html?thread=118966>выражаются вполне конкретно</a>

ещё у них на форуме постили исходники другого SGEMM-а, котор

vasionok (not verified) - 02/Фев/2008 23:13

ещё у них на форуме постили исходники другого SGEMM-а, который раза в полтора быстрее чем в CUBLAS :)

Ну да, я помню. Но интересно разобраться в разнице в подход

lexa - 02/Фев/2008 23:46

Ну да, я помню.

Но интересно разобраться в разнице в подходах. Пока я буквально 5 секунд смотрел и увидел, что данные хранятся в текстурах. Спорный подход.

да да,насчет ати поподробнее плиз

Oktan (not verified) - 03/Фев/2008 05:08

да да,насчет ати поподробнее плиз