Про Intel и OpenCL

И вторая за сегодня новость про OpenCL.

Вышел интеловский SDK (SDK for OpenCL Applications 2013 Release). А там, кроме всего прочего такое вот:

Support in dual adapter mode on Windows* 8: enables OpenCL workloads to be accelerated on Intel HD Graphics when the device is not directly connected to a display and fully enabled running Intel driver.
Я осуждаю то, что это только для Win8, а сам факт - одобряю. На Ivy Bridge/Haswell можно будет посчитать что-нибудь эдакое без чудовищного оверхеда по копированию по PCIe (а, всего-лишь, с небольшим оверхедом на double buffering :)

Comments

что то типа
PCIe 3.0 x16/15.75(GB/s) versus IMC/25.6(GB/s)

Ну теоретические цифры примерно такие.

А на практике разница будет и больше
- одно неловкое движение и x16 стала x8 (lanes мало, PCIe карт может быть много)
- даже на x16 реальные скорости не 15.75, а в районе 12 (а у памяти ~22-25 - достижимо)

Ну и результат расчета уж всяко можно получить в свое адресное пространство простым мэппингом, без копирования. А если нельзя - то сделают же.

- одно неловкое движение и x16 стала x8
не понял этого,
lanes жестко выведены - если вставил карту в правильный слот -> все.

маппинг - ну да, должен когда то быть ....

Нет, увы.

Вот типичная современная материнка: http://www.asus.com/Motherboards/MAXIMUS_V_FORMULA/#specifications

3 слота x16, но в зависимости от наличия в этих слотах вставленного:
1 x16
2 x8
x8, x4, x4

Т.е. всего в эти три слота заведено 16 lanes, а дальше оно скоммутируется в зависимости от установленных карт расширения.

Что, собственно, неудивительно - у процессора всего 16 lanes PCIe3, все они и заведены в эти три слота.

это "довольно бюджетная" (sorry) мамка - с нее и спросу нет
смотреть лучше по ее чипсету: Intel Z77 Express Chipset
http://www.intel.de/content/www/us/en/chipsets/performance-chipsets/z77-...
да - 16 lines и дальше - игры OEM/BIOS....

обычно говорят о полном количестве lines, например только у Extreme Edition их может быть 40 и два честных x16
http://www.intel.de/content/www/us/en/chipsets/performance-chipsets/x79-...

никто и никуда это "не уводит" :)

Да, у сокета 2011 - 40 lanes. Но это - очень редкий зверь на самом деле (для десктопа)

А у 1155 все просто - у процессора 16 lanes. Дальше их обычно раскидывают на несколько длинных слотов, а не на один. Дальше - если мы используем два слота (видеокарта и RAID-контроллер, к примеру), то будет 2 x8.

Да, есть варианты. На "workstation"-мамки ставят PCI-express свитчи и тогда RAID и видео работают по очереди (у процессора - 16 lanes и новые не отрастают)

мы говорим о самом самом :D

не, я скорее о реальной практике.