В этом месте есть традиция буквального перевода.
Яндекс:
"вычисления с плавающей запятой" - 2836 страниц
"вычисления с плавающей точкой" - 3861 страница
И в далеком 85-м году меня учили, естественно, про плавающую точку.
<q> Гигафлопс одинарной точности стоит:
* $1.3 если его покупать в виде NVidia Geforce GTX280
* $2.9 в виде Intel Core2Quad Q9300 (разогнанный до 3GHZ,</q>
Q6600 2.4GHz стоит $190
Q9650 3.0GHz стоит $550
Сколько будет стоить гигафлопс в виде Q6600?
А если оптом, в виде стопки 1U blades?
<q> десктопная система допускает легкое и недорогое масштабирование еще втрое (путем добавления видеокарт). </q>
Q6600 - это же предыдущее поколение, до penryn. Там реальное быстродействие ~5 гигафлопсов на гигабайт на ядро (у penryn - 7.2). У 2.33GHz Woodcrest было 48 гигафлопсов с одинарной точностью, т.е. у Q6600 на штатной частоте будет ~50. Даже если разогнать до трех - ну 62.5 (как я в прошлом забеге писал, <a href=http://www.gpgpu.ru/articles/sgemm-6.html>Penryn - феноменально быстрый</a>). Т.е. для разогнанного Q6600 получается те же $3 за гигафлопс.
А так - ты все правильно говоришь: если растить производительность дальше, то рано или поздно придешь к большому количеству ящиков и необходимости завести между ними быструю сеть. Infiniband/10GE сейчас сильно подешевел и это стало довольно доступно, 3-4 килобакса за порт (считая и свитч), может и дешевле. Ну и всякий секс с MPI и прочими подобными кластерными решениями.
Фишка в том, что чтобы догнать один 500-баксовый GPU по производительности с одинарной точностью (а одинарная точность в очень многих задачах устраивает) - придется собирать что-то вроде 4 штук 6-ядерных Xeon 7xxx. А чтобы догнать три - гарантированно понадобится стопка блейдов. При этом, если задача паралелится на совсем независимые (брутфорс подбор пароля), то быстрой сети не надо, а если не параллелится - то надо. А 500-баксовые GPU соединены PCI Express, который примерно как 40-гигабитный ethernet, а не как 10-гигабитный.
Ну и до 2.5 терафлоп (одинарной точности) с сохранением PCI-e "сети" можно дорастить, причем это будет в районе 2 киловатт по электричеству (две 1U-теслы плюс управляющий писюк).
Конечно, есть задачи, где одинарной точности мало. Но и на "обычных процессорах" сейчас делают гибридную схему (т.к. одинарная точность тупо вдвое быстрее) и на GPU оно стало разумно.
Вообще, мой поинт в том, что если нужно относительно много считать, а задача end-user-ская, то не смотреть сейчас на видеокарты преступно. Это задачи вроде шумопонижения, той же демозаики, видеоредактирования в реалтайме, всякая HD-рекомпрессия и так далее.
И про электричество - один GTX260 + 4 гига памяти (в виде теслы) жрут 180 ватт в пике. Т.е. 3 карты + PC - будет ватт 700. Тоже дофига, но зимой даже приятно :)
С одной стороны - я полностью согласен, достало неимоверно.
С другой - если брать не расчетные задачи, а нормальные end-юзерские, с тем же шумопонижением, то это и не ограничение вовсе, там нужен респонс в миллисекунды, вотчдог не мешает.
NVidia, если не путаю, говорит, что с Теслой этих проблем нет.
У меня все руки чешутся попатчить 8800GTX, чтобы она представлялась как Quadro и посмотреть, есть ли бага в квадровских драйверах (и второе желание, конечно, это плагинов для Quadro CX натырить)
Хотя, конечно, ждем DX11 или OpenCL, кто уж быстрее успеет.
Comments
Помнишь про SSD говорили? Вот такую штуку нашёл http://www.
Помнишь про SSD говорили?
Вот такую штуку нашёл
http://www.kinor.ru/en/products/mediatorpc/
Недавно в каком-то из толстых блогов (techcrunch или engadge
Недавно в каком-то из толстых блогов (techcrunch или engadget - у меня они в читалке перемешаны) пробегал подобный девайс. Fusion-IO.
Их сейчас много будет, проблема в том, что им нужны свои драйвера.
Я не очень понял про этот русский девайс -- с одной стороны
Я не очень понял про этот русский девайс -- с одной стороны упоминается 4 штуки на SATA-контроллер, с другой -- интерфейсы PCI и Fiberchannel...
И много других страшных слов, наверное они еще сами не решил
И много других страшных слов, наверное они еще сами не решили
Вы имеете в виду с плавающей <em>запятой</em>?
Вы имеете в виду с плавающей <em>запятой</em>?
floating <em>comma</em>? Нет, ничего такого я в
floating <em>comma</em>?
Нет, ничего такого я в виду не имею!
А что такое <em>floating comma</em>? То же само
А что такое <em>floating comma</em>? То же самое, что и <em>плавающая точка</em>? Просто оба словосочетания отсутствуют в соответствующих языках.
Да ладно, отсутствуют. В этом месте есть традиция буквально
Да ладно, отсутствуют.
В этом месте есть традиция буквального перевода.
Яндекс:
"вычисления с плавающей запятой" - 2836 страниц
"вычисления с плавающей точкой" - 3861 страница
И в далеком 85-м году меня учили, естественно, про плавающую точку.
Т.е. в остальных годах это всё же была плавающая запятая? :-
Т.е. в остальных годах это всё же была плавающая запятая? :-)
Меня в далёких девяностых учили, естественно, про плавающую запятую.
Похоже, что таких старых как я - пока больше. Или они пишут
Похоже, что таких старых как я - пока больше. Или они пишут больше текстов.
Но пока в языках программирования дробная часть отделяется точкой - плавающую запятую и не поймут даже.
<q> Гигафлопс одинарной точности стоит: * $1.3 если е
<q> Гигафлопс одинарной точности стоит:
* $1.3 если его покупать в виде NVidia Geforce GTX280
* $2.9 в виде Intel Core2Quad Q9300 (разогнанный до 3GHZ,</q>
Q6600 2.4GHz стоит $190
Q9650 3.0GHz стоит $550
Сколько будет стоить гигафлопс в виде Q6600?
А если оптом, в виде стопки 1U blades?
<q> десктопная система допускает легкое и недорогое масштабирование еще втрое (путем добавления видеокарт). </q>
http://www.guru3d.com/article/geforce-gtx-280-review-test/11
PC in Idle = 184 Watt
PC 100% usage (wattage gaming Peak) = 363 Watt
3*363 = 1089 Watt только для видео.
Ты уверен, что хочешь _это_ под столом?
Яйца рекомендуют держать в холоде.
PS. Однако, определение "настоящий компьютер потребляет киловатт" возврашается в жизнь.
Q6600 - это же предыдущее поколение, до penryn. Там реальное
Q6600 - это же предыдущее поколение, до penryn. Там реальное быстродействие ~5 гигафлопсов на гигабайт на ядро (у penryn - 7.2). У 2.33GHz Woodcrest было 48 гигафлопсов с одинарной точностью, т.е. у Q6600 на штатной частоте будет ~50. Даже если разогнать до трех - ну 62.5 (как я в прошлом забеге писал, <a href=http://www.gpgpu.ru/articles/sgemm-6.html>Penryn - феноменально быстрый</a>). Т.е. для разогнанного Q6600 получается те же $3 за гигафлопс.
А так - ты все правильно говоришь: если растить производительность дальше, то рано или поздно придешь к большому количеству ящиков и необходимости завести между ними быструю сеть. Infiniband/10GE сейчас сильно подешевел и это стало довольно доступно, 3-4 килобакса за порт (считая и свитч), может и дешевле. Ну и всякий секс с MPI и прочими подобными кластерными решениями.
Фишка в том, что чтобы догнать один 500-баксовый GPU по производительности с одинарной точностью (а одинарная точность в очень многих задачах устраивает) - придется собирать что-то вроде 4 штук 6-ядерных Xeon 7xxx. А чтобы догнать три - гарантированно понадобится стопка блейдов. При этом, если задача паралелится на совсем независимые (брутфорс подбор пароля), то быстрой сети не надо, а если не параллелится - то надо. А 500-баксовые GPU соединены PCI Express, который примерно как 40-гигабитный ethernet, а не как 10-гигабитный.
Ну и до 2.5 терафлоп (одинарной точности) с сохранением PCI-e "сети" можно дорастить, причем это будет в районе 2 киловатт по электричеству (две 1U-теслы плюс управляющий писюк).
Конечно, есть задачи, где одинарной точности мало. Но и на "обычных процессорах" сейчас делают гибридную схему (т.к. одинарная точность тупо вдвое быстрее) и на GPU оно стало разумно.
Вообще, мой поинт в том, что если нужно относительно много считать, а задача end-user-ская, то не смотреть сейчас на видеокарты преступно. Это задачи вроде шумопонижения, той же демозаики, видеоредактирования в реалтайме, всякая HD-рекомпрессия и так далее.
И про электричество - один GTX260 + 4 гига памяти (в виде теслы) жрут 180 ватт в пике. Т.е. 3 карты + PC - будет ватт 700. Тоже дофига, но зимой даже приятно :)
>> Вообще, мой поинт в том, что если нужно относительн
>> Вообще, мой поинт в том, что если нужно относительно много считать, а задача end-user-ская, то не смотреть сейчас на видеокарты преступно.
+1. eche bi reshili problemu s watch dog i platforma gotova.
С одной стороны - я полностью согласен, достало неимоверно.
С одной стороны - я полностью согласен, достало неимоверно.
С другой - если брать не расчетные задачи, а нормальные end-юзерские, с тем же шумопонижением, то это и не ограничение вовсе, там нужен респонс в миллисекунды, вотчдог не мешает.
NVidia, если не путаю, говорит, что с Теслой этих проблем нет.
У меня все руки чешутся попатчить 8800GTX, чтобы она представлялась как Quadro и посмотреть, есть ли бага в квадровских драйверах (и второе желание, конечно, это плагинов для Quadro CX натырить)
Хотя, конечно, ждем DX11 или OpenCL, кто уж быстрее успеет.