Про Geforce Titan GTX

Интересная история происходит с Geforce Titan GTX. Все ожидали вчера анонса и 3dnews его даже выпустил в 21:00 т.е. все было готово. А потом - спрятал (ссылка - из гуглокэша, скоро протухнет). ixbt опубликовал тот же текст но как последние слухи. Аналогичная история приключилась c expertreviews.co.uk - они дернулись аж в 14:00 (по своему UK-ному времени, насколько я могу судить, по времени появления ссылок на них в твиттере).

Короче, что-то с анонсом пошло не так, на прошлой неделе было точно всем известно, что анонс будет 18-го, но его не случилось, на сайте NVidia - тишина.

Маловероятно, что продукт уберут в последнюю секунду и не будут аносировать, хочется его обсудить в предположении что он (уже почти) есть:

Что мы тут видим:
  • Это Tesla K20X по количеству памяти и конфигурации собственно вычислительного чипа (14 SMX).
  • Частоты - выше на 15% и для памяти и для чипа. Соответственно, выше быстродействие в Single Precision (4.5 против 3.95 TFlops, ровно на частоту), выше должна быть и memory bandwidth (как минимум 285Gb/sec если тупо скейлить спеки по частоте, но в предыдущих поколения разница была больше чем "на частоту" т.к. в теслах ECC, а в юзерских картах - нет).
  • Следовало бы ожидать, что и Double Precision флопсы будут на те же 15% выше (если чип тот же), т.е. 1.5 терафлопса против 1.3 у K20X. Однако в спеках написано 1.3 - и это мне непонятно. Либо другой чип все-таки (но 4.5/1.3=3.46 - какое-то непонятное соотношение. У Тесл на GK110 было 1:3, у тесл на Fermi 1:2), либо ошибка в спецификациях (но так как картинки на всех сайтах одинаковые - это картинки же из пресс-кита).
  • Полностью открыт вопрос о версии "hardware capability". Я предполагаю, что это SM3.5, со всеми наворотами вроде Dynamic Parallelism и прочего Hyper-Q, но подтверждений никаких нет. Была бы DP:SP performance 1:3 - и вопроса бы никакого не было, это GK110 с видеовыходами. Пока же - неясно.
Цена - относительно K20X - обещает быть вкусной. K20X по list price стоит $5000, купить можно за 4600, а Titan GTX будет стоить, по разным данным, от $900 до $1300. Как следствие, Dynamic Parallelism и прочие навороты GK110 можно будет донести до девелопера в 4-5 раз дешевле: в отличие от предыдущих поколений, когда все навороты Fermi были доступны и на игровых картах (да, пусть DP сильно медленнее, не 1:2 как на Tesla, а аж 1:12 как на GF110, но все ж работало), текущая разница между GK110/GK104 была именно в отсутствии поддержки всякого интересного.

Ну и если с DP-перформансом не наврали на слайдах, терафлопсный (DP) барьер на десктопах взят с изрядным запасом. Не "около терафлопса" как у 7970 (чуть больше в "гигагерц edition), а с приличным запасом, терафлопс увидим в реальных приложениях.

Вот чего я опасаюсь, конечно - так это того, что динамические фичи будут настолько хороши, что реальный буст в реальных приложениях будет действительно большой. Под старое железо будет же неинтересно и противно писать.

Comments

Ну вот, будет на чем Кризис 3 запустить.

А клевещут, прямо вот в слайдах по ссылкам, что на GTX680 в 3-м кризисе 35fps. Этого мало?

35 и 45 средних - разная вещь :) В первом случаи это с большей вероятностью значит проседания до <15.

Ну сингл пройти, полюбоваться - может и хватит. А в мультиплеере погонять маловато. К тому же у меня не 680, а 670 :) Поэтому будем ставить не very high, а просто high. Потому что разница там не слишком заметна. Вот кстати http://www.youtube.com/watch?v=CH_F5a_Qbj0

Как я понял анонс сегодня, но NDA на обзоры снимают в четверг. На anandtech'е уже кое что опубликовали:
http://www.anandtech.com/show/6760/nvidias-geforce-gtx-titan-part-1

Там объяснили почему 4.5ТФлопс FP32, но 1.3FP64, к слову.

Прикольно:
"Consequently NVIDIA makes FP64 an enable/disable option in their control panel, controlling whether FP64 is operating at full speed (1/3 FP32), or reduced speed (1/24 FP32)."

Типа, FP64 на полной скорости греется.

Фальстарт? Сейчас и 3DNews вернули обзор http://www.3dnews.ru/news/641694/ и много кто еще (Tom's hardware, bit-tech, overclockers.ua, the verge) повыкладывали.

Ну, да, фальстарт. На прошлой неделе было известно, что старт 18-го (я не знал в какое время, но предполагал что часов в 9-10 по Калифорнии, как обычно). Но потом там что-то скомкалось.

Анонсировали, никуда не делись

Сегодня больше конкретики уже

http://www.overclockers.ru/hardnews/52242/Po_puti_k_ljubitelyam_igr_GK11...

По умолчанию скорость выполнения вычислений с двойной точностью ограничена соотношением 1/24 FP32, для реализации полных возможностей она увеличивается до 1/3 FP32. Поскольку частота процессора при этом снижается с 837 до 725 МГц, мы наблюдаем, что быстродействие вычислений FP64 снижается не в три раза, как предписывает делитель 1/3, а сильнее: с 4,5 терафлопса до 1,3 терафлопса.