sandy bridge

Q: низкопотребляющие i5-SandyBridge

А вот к примеру есть два процессора:
  • i5-2400: 3.1Ghz, турбо на одном ядре до 3.3, 95 ватт.
  • i5-2400S: 2.5Ghz, турбо на одном ядре до 3.3, 65 ватт.
А сколько будет жрать i5-2400 (без S), если ему стандартный мультипликатор снизить до 25? Впишется ли в 65 ватт?

статью на fcenter, где намерили разницу в 12 ватт вместо 30 - читал. Ну и общий консенсус, дескать у S-моделей с производительностью на ватт хуже, чем у соседей по линейке - заметил. И что ватты эти - условные ("не больше, а меньше - бывает") - тоже усвоил.

Но вопрос у меня совсем конкретный - никто не встречал замеров по тепловыделению/потреблению для андерклоченных горшков?

Опять-снова о производительности ZFS

В процессе борьбы за увеличение количества PCI-e слотов в домашнем NAS, взял я кровные 300 баксов и отнес их в лабаз, где и приобрел:

  • 2x4GB памяти DDR3-1600
  • Процессор i3-2120
  • Материнку Gigabyte GA-Z68MA-D2H-B3 (3 длинных PCIe слота, x16, x8 и x4!)
На общую сумму 8800р или что-то вроде этого.

В сравнении с тем что было (Core2Quad Q9300, 8Gb), общий перформанс вырос не слишком сильно. make -j8 buildworld шел 44 минуты, а теперь идет 37. Это на SSD-диске.

А вот на ZFS (RAIDZ, 5 дисков Seagate 3Tb с гигабайтными пластинами) перформанс выстроился так (результаты кроме первого я уже приводил).

Тестирование путем dd if=/dev/zero of=file bs=1G count=50

  • 437 Mb/sec - Core i3-2120, память DDR3-1600 (8Gb, два канала)
  • 360 Mb/sec - Core i7-920, память DDR3-1333 (12Gb, три канала)
  • 280 Mb/sec - Core2 Quad Q9300, память DDR2-800 (8Gb, сколько каналов не знаю)
При этом, вторая система (i7-920) сильно быстрее всех прочих по горшку и, по идее, не сильно медленнее первой по памяти (потому что три канала, а не два).

В этом тесте я все еще не вижу 100% disk load в systat -vm/iostat -x, но к нему стало ближе. Ну и полоса записи на отдельный диск наконец выросла over 100Mb/sec.

Упирается ли оно в CPU - не могу понять. С одной стороны, на всех 4-х (гипертрединг же) CPU idle time в районе 80%. С другой стороны - как эти проценты считаются на HT мне вовсе неясно, может их там не 80, а 40, а из 60% загрузки ту самую половину (которую уже обсуждали) выжирает ZFS (т.е. ядерный код) и еще процентов 10 - прерывания.

При случае, суну эти же диски в ящик с i7-2600K, но случая придется ждать долго. Вопрос на самом деле важный, может быть имело смысл потратить не $300, а $380 и горшок взять покруче, вроде i5-2400S.

О memory bandwidth - 2

Алаверды к предыдущему посту, выношу отдельно, потому что важно.

Sisoft Sandra-й намеряли совсем другие цифирки по memory bandwidth:

  • Ocaholic.ch: 39-40Gb/sec у 3930k/3960x, против 27Gb/sec у i7 2600k (частоты штатные).
  • Overclockersclub.com: примерно то же на штатной частоте, 47 Gb/sec для overclocked-процессора (3960X @4.73Ghz).
А предыдущие цифры (3Dnews) были получены AIDA64.

Вероятнее всего фишка в том что в один поток или в несколько - большая разница.

О memory bandwidth

Вот картинка:

Взято с 3Dnews, но примерно такие же по смыслу цифирки в обзоре Ф-центра, там у них еще круче: в новых CPU использование 2 каналов памяти чуть быстрее чем 3-4-х каналов, а разница с 2600k поменьше.

Чувствую какую-то ерунду, трудно же должно быть сделать 4-канальный контроллер памяти медленнее 2-канального?

Вместе с тем, это избавляет от излишних терзаний, апгрейдить 2600K на домашней WS явно не надо (за исключением случаев упора в 4 ядра, но в память упереться всяко проще).

Update: продолжение тут: О memory bandwidth - 2.

О взаимном знании двух рук

Надо сказать, что сочетание Sandy Bridge и интеловских средств профайлинга производит тягостное впечатление.

На i7 (предыдущего поколения) был у меня VTune Amplifier XE из состава Intel C++ Composer XE (12-я версия компилятора, а версию VTune я не считал). И все работало, никаких проблем.

После замены процессора VTune сказала мне, что hardware sampling на этой архитектуре она не умеет. Ну ладно, компилятор вышел в конце 2010-го, тогда Sandy Bridge в продаже не было (у интела, впрочем, были, как мне кажется).

Ставим C++ Composer XE update 1 (где-то февральский, если я не путаю). При установке он предупреждает, что тоже не умеет hardware sampling на этой архитектуре. Ну, странно да. Одновременно отваливается и User Mode Sampling, да.

Но есть еще VTune Amplifier XE update 2, совсем свежий. Ставим его. Аппаратный самплинг появляется, но User Mode так и не работает. И это известная проблема, советуют you can try to re-install the product. Running it on a different machine should help also. Тьфу. Как-то я был лучшего мнения об интеловских разработках.

Конечно, с lightweight hotspots (без анализа стека) можно как-то жить, но довольно неудобно. MS-овский профайлер работает настолько медленно, что это ужоснах.

Да, я try reinstalling, не помогло. Different machine у меня в данный момент нет.

Зыбкий мост

Долго крепился, но против желания попрограммировать на AVX устоять невозможно.

Приколы Sandy Bridge/P67:

  • У Асуса на сайте написано "в связи с ограничениями чипсета P67, память 1866 работает как 1600". И вправду. Ставишь 1866 (память поддерживает по спекам, на X58 работала на 1800) - все начинает валится с грохотом, Win7 ни разу не загрузились, но каждый раз с разной ошибкой. На 1600 - все отлично.
  • CoreTemp 0.99.5 показывает удвоенную температуру (в цельсиях). Гы.
  • Я подозревал, что скорость линейного чтения/записи памяти пострадает. На X58 было три канала, тут - два, память одна и та же. Жизнь оказалась веселее:
    • С точки зрения SiSoft Sandra Lite, у меня было 25Gb/sec memory bandwidth на i7-920 (3 канала), а стало 20Gb/sec на i7-2600K (2 канала). И я даже с этим не спорю.
    • Но вот AIDA64 (бывш. Everest) считает, что было 16/14/19 (GB/sec,read/write/copy), а стало 19/19/21
    И логика велит мне согласиться с Сандрой (каналов меньше, память та же), а сердце говорит, что в моих личных тестах я получал цифири, куда более близкие к эвересту.
Пойду, до пяти гигагерц ея разгоню.....
Subscribe to sandy bridge