Исходники CuBLAS/CuFFT
lexa - 02/Фев/2008 21:14
Программирующим на CUDA может быть интересно: NVidia начала раздавать исходники библиотек CUBLAS/CUFFT.
Я, правда, не очень понимаю статус этого дела:
- С одной стороны, все выложено на девелоперском сайте, куда нужна регистрация (и говорят, что стоит большая очередь желающих оной регистрации, хотя меня в прошлом году зарегистрировали за один день).
- С другой стороны, в девелоперской рассылке пришли ссылки на незапароленый сайт, бери кто хочет.
А вот что точно открыто всем желающим, так это визуальный профайлер (beta) для той же CUDA. Пока не смотрел, руки не дошли.
Comments
а что насчет атишного терафлопа?
а что насчет атишного терафлопа?
Ну так он должен появиться в Q1 2008. Подозреваю, что еще н
Ну так он должен появиться в Q1 2008.
Подозреваю, что еще не появился.
Кстати, откуда терафлоп ? FireStream 9170 (который объявлен
Кстати, откуда терафлоп ? FireStream 9170 (который объявлен в ноябре,
но вроде пока не продается) - 500 гигафлопов
http://ati.amd.com/products/streamprocessor/specs.html
видимо имеется в виду HD3870 (RV680)?
видимо имеется в виду HD3870 (RV680)?
Только с двумя гигами памяти и с обещанием арифметики в doub
Только с двумя гигами памяти и с обещанием арифметики в double.
Может и спец-чип (а может в 680 double есть, я в ATI не разбираюсь).
а что, два гига -- это плохо? и у них еще X2 вроде есть, сдв
а что, два гига -- это плохо?
и у них еще X2 вроде есть, сдвоенная.
Два гига - это отлично. А со сдвоенными картами я не понима
Два гига - это отлично.
А со сдвоенными картами я не понимаю базовых вещей: память же не общая ?
не знаю, там еще про crossfire упоминают
не знаю, там еще про crossfire упоминают
вроде при работе в SLI в CUDA память становится виртуально о
вроде при работе в SLI в CUDA память становится виртуально общая. а физически она конечно не общая, более того, на X2 3870 шина на каждый GPU только 256 бит и карта не поддерживает PCI-E 2.0, т.е. много времени будет уходить на обмен с основной памятью.
Что-то я пугаюсь. Чтобы оно было виртуально общим и при этом
Что-то я пугаюсь.
Чтобы оно было виртуально общим и при этом еще и работало, там же нужно очень многое доделать. Когерентность кэшей (текстурных), например.
Я, натурально, не пробовал, а знающие люди <a href=http://alextutubalin.livejournal.com/53430.html?thread=118966>выражаются вполне конкретно</a>
ещё у них на форуме постили исходники другого SGEMM-а, котор
ещё у них на форуме постили исходники другого SGEMM-а, который раза в полтора быстрее чем в CUBLAS :)
Ну да, я помню. Но интересно разобраться в разнице в подход
Ну да, я помню.
Но интересно разобраться в разнице в подходах. Пока я буквально 5 секунд смотрел и увидел, что данные хранятся в текстурах. Спорный подход.
да да,насчет ати поподробнее плиз
да да,насчет ати поподробнее плиз