Алаверды к этому посту
================================================================================
HPL-GPU 1.1.0 -- High-Performance Linpack benchmark -- 2010
Written by D. Rohr, M. Kretz and M. Bach, Frankfurt Institute for Advanced Studies
...
================================================================================
...
================================================================================
T/V N NB P Q Time CPU Gflops
--------------------------------------------------------------------------------
WC26L2C32 124928 2048 1 1 753.87 11956.78 1.724e+03
--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)= 0.0001192 ...... PASSED
================================================================================
Finished 1 tests with the following results:
1 tests completed and passed residual checks,
0 tests completed and failed residual checks,
0 tests skipped because of illegal input values.
--------------------------------------------------------------------------------
End of tests.
================================================================================
Оборудование то же: 2x AMD Opteron 6176, 128Gb RAM, 2x AMD/ATI HD6990, полтора киловатта питания, 1/2U.
А (почти) полтора раза (в сентябре было 1229 GFlop/s) получаются за счет, блин, "тонких" оптимизаций: точного раскидывания ядер по задачам (эти - только I/O с картой и т.п.), экономии этих самых ядер т.к. часть вычислений делается на CPU и так далее...
В сравнении с Fermi, получается сильно дешевле, сильно компактнее, но много более сексуально в программировании.
P.S. Больше подробностей - не раньше декабря.