Skip to Content

Исходники CuBLAS/CuFFT

Программирующим на CUDA может быть интересно: NVidia начала раздавать исходники библиотек CUBLAS/CUFFT.

Я, правда, не очень понимаю статус этого дела:

  • С одной стороны, все выложено на девелоперском сайте, куда нужна регистрация (и говорят, что стоит большая очередь желающих оной регистрации, хотя меня в прошлом году зарегистрировали за один день).
  • С другой стороны, в девелоперской рассылке пришли ссылки на незапароленый сайт, бери кто хочет.
Посему, ссылки не публикую, если кому-то нужно и нет терпения ждать (со временем все попадает в полностью открытый доступ, всегда так было) - пишите лично.

А вот что точно открыто всем желающим, так это визуальный профайлер (beta) для той же CUDA. Пока не смотрел, руки не дошли.

Comments

а что насчет атишного терафлопа?

а что насчет атишного терафлопа?

Ну так он должен появиться в Q1 2008. Подозреваю, что еще н

Ну так он должен появиться в Q1 2008.

Подозреваю, что еще не появился.

Кстати, откуда терафлоп ? FireStream 9170 (который объявлен

Кстати, откуда терафлоп ? FireStream 9170 (который объявлен в ноябре,
но вроде пока не продается) - 500 гигафлопов

http://ati.amd.com/products/streamprocessor/specs.html

видимо имеется в виду HD3870 (RV680)?

видимо имеется в виду HD3870 (RV680)?

Только с двумя гигами памяти и с обещанием арифметики в doub

Только с двумя гигами памяти и с обещанием арифметики в double.
Может и спец-чип (а может в 680 double есть, я в ATI не разбираюсь).

а что, два гига -- это плохо? и у них еще X2 вроде есть, сдв

а что, два гига -- это плохо?
и у них еще X2 вроде есть, сдвоенная.

Два гига - это отлично. А со сдвоенными картами я не понима

Два гига - это отлично.

А со сдвоенными картами я не понимаю базовых вещей: память же не общая ?

не знаю, там еще про crossfire упоминают

не знаю, там еще про crossfire упоминают

вроде при работе в SLI в CUDA память становится виртуально о

вроде при работе в SLI в CUDA память становится виртуально общая. а физически она конечно не общая, более того, на X2 3870 шина на каждый GPU только 256 бит и карта не поддерживает PCI-E 2.0, т.е. много времени будет уходить на обмен с основной памятью.

Что-то я пугаюсь. Чтобы оно было виртуально общим и при этом

Что-то я пугаюсь.
Чтобы оно было виртуально общим и при этом еще и работало, там же нужно очень многое доделать. Когерентность кэшей (текстурных), например.

Я, натурально, не пробовал, а знающие люди <a href=http://alextutubalin.livejournal.com/53430.html?thread=118966>выражаются вполне конкретно</a>

ещё у них на форуме постили исходники другого SGEMM-а, котор

ещё у них на форуме постили исходники другого SGEMM-а, который раза в полтора быстрее чем в CUBLAS :)

Ну да, я помню. Но интересно разобраться в разнице в подход

Ну да, я помню.

Но интересно разобраться в разнице в подходах. Пока я буквально 5 секунд смотрел и увидел, что данные хранятся в текстурах. Спорный подход.

да да,насчет ати поподробнее плиз

да да,насчет ати поподробнее плиз

Post new comment

The content of this field is kept private and will not be shown publicly.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <s> <i> <b> <blockquote>
  • Lines and paragraphs break automatically.
  • You can enable syntax highlighting of source code with the following tags: <code>, <blockcode>, <c>, <cpp>, <drupal5>, <drupal6>, <java>, <javascript>, <php>, <ruby>. The supported tag styles are: <foo>, [foo].
  • Images can be added to this post.

More information about formatting options



.