Про AMD FirePro W9100

Вот между прочим, AMD выступила очень достойно с FirePro W9100: они сделали чип у которого отношение производительности Single Precision : Double Precision 1:2, вместо обычных для AMD 1:4 (а на HD5xxx было 1:5)

В результате у них 2.6TFlops DP (теоретической), что в 1.85 раза больше, чем у (самой толстой на сегодня) NVidia Tesla K40 (1.4Tflops теоретических).

Да, у AMD не все здорово с софтовой частью: все кто вычислял вычисления уже привыкли к CUDA, перенос кода на OpenCL и оптимизация для AMD займут время, но почти двукратный выигрыш по перформансу (и еще больше, по прайс-перформансу, если сравнивать с Теслой) - взбодрит разработчиков.

Я ожидаю, в первую очередь, взбодрения всяких CAD-ов. Это FirePro не выглядит картой для вычислительных кластеров (коим 6 видео-выходов без нужды), а вот на рабочих станциях, и 3D-графика и ее обсчет на одной карте - очень к месту ж.

Ждем, естественно, ответа NVidia. Так, по идее, Maxwell - хороший, 750Ti обгоняет 650Ti на вычислениях прилично так (при меньшем количестве cores и достаточно близких частотах).

P.S. Конечно, лидером по price/perf (DP) остается NVidia Титан, но это другая история (на Титан, в числе прочего, драйвера от Квадры не натянуть, т.е. всякие CAD-ы пролетают).

Comments

Вопрос ещё, что там с охлаждением. Потому что есть подозрение, что там тот же кулер, что и на R9 290, а это шум и троттлинг (и падение производительности, как следствие).

Что мешает поставить СО поадекватнее? У того же Arctic Cooling есть отменные решения. Если в системе 1 карта очень Ок (с их СО карта занимает 3 места).

> 750Ti обгоняет 650Ti на вычислениях прилично так (при меньшем количестве
> cores и достаточно близких частотах).

и при два раза меньшем потреблении...

Вообще-то лидер по DP FLOPS/$ - Radeon R9 280X от XFX (Black Edition Double D), который доставляет 1.1 TFLOPS (1.08 GHz x 2048 Streaming processors x 2 (FLOPS/FMA) x 1/4 (DP ratio)) за ~350 енотов

Вообще-то лидер по DP FLOPS/$ - Radeon R9 280X от XFX (Black Edition Double D), который доставляет 1.1 TFLOPS (1.08 GHz x 2048 Streaming processors x 2 (FLOPS/FMA) x 1/4 (DP ratio)) за ~350 енотов

А что у него при этом с реальной жизненной производительностью?

Там OpenCL привели в чувство после HD6xxx (где оно было так себе)?

Не знаю. Единственное приложение, которое я запускаю на GPGPU, на OpenCL всё равно работать не будет.

Ну вот когда я этим интересовался (~2.5-3 года назад) было смешно:

HD5xxx/6xxx старшие, по всем спекам - сильно-сильно быстрее GTX480 (раза в два, что в DP, что в SP).
Берем примеры из AMD-шного SDK, должны быть, по идее, оптимизированы под эти карты.
Однако NVidia их исполняет (которые исполняет) - что-то быстрее, что-то примерно так же (что-то, конечно, и медленнее, что на архитектуру совсем уж не ложится).

На HD7970 я уже так внимательно не смотрел, не помню уже что и как.