О memory bandwidth

Вот картинка:

Взято с 3Dnews, но примерно такие же по смыслу цифирки в обзоре Ф-центра, там у них еще круче: в новых CPU использование 2 каналов памяти чуть быстрее чем 3-4-х каналов, а разница с 2600k поменьше.

Чувствую какую-то ерунду, трудно же должно быть сделать 4-канальный контроллер памяти медленнее 2-канального?

Вместе с тем, это избавляет от излишних терзаний, апгрейдить 2600K на домашней WS явно не надо (за исключением случаев упора в 4 ядра, но в память упереться всяко проще).

Update: продолжение тут: О memory bandwidth - 2.

Comments

Я со своим Core i7-920 о 6 гигах вообще чувствую себя владельцем динозавра собственноручной сборки конца 2009-го, и стало как-то грустно, когда узнал, что с выходом второй редакции Core i7 жизнь сокета 1366 закончилась и что я не куплю через пару лет 12-ядерный камень с минимальными затратами на апгрейд системы. Но с другой стороны производительности хватает с головой и хочется от нечего делать доставить еще 6 гигов ОЗУ и SSD винт под систему.

Да, с 1366 нехорошо получилось. Когда он выходил, было неочевидно, что это тупиковая ветка.

Понять бы это про 2011 - если там планируются горшки с интегрированной графикой (графика нафиг не нужна, а APU - нужен), то это один разговор. Не планируются - другой....

очевидно, что все ветки стремятся сделать тупиковыми.
иное не выгодно с маркетинговой кочки

У AMD маркетинг построен на обратной идее. И тоже работает.

А касаемо выгод - не знаю. При "смене всего" деньги получает не только интел.

У AMD маркетинг построен на обратной идее. И тоже работает.

ой да сказки поди.
там или БП новый нужен будет или еще чего вылезет

А касаемо выгод - не знаю. При "смене всего" деньги получает не только интел.

это вся индустрия такая.

10 лет IDE шнурки с питаловом держались -- и до них добрались.

Вот уж ради смены IDE-шнурков на SATA/SAS (еще и совместимых в одну сторону) - я готов потерпеть несовместимость!

С AMD пошел разбираться и запутался нахрен в AM2/AM2+/AM3. Там что-то совместимое в разные стороны. Вроде бы AM2+ (2007) принимает AM3-процессоры. 4 года значит, большой срок. Примерно как у S478-го

даже больше, получается.
взял ам3 с прицелом лет через 5 поставить туда новый процессор и удвоить производительность на домашнем сервере. памяти там правда 16гб максимум опять же - двухканалку взял сдуру, как и на i72600

Через 5 лет будут 8-гиговые модули, поди. Или 16-ти.

Они уже и сейчас есть, просто стоят как мнээ (да-да, НЕбуферизированные!)

Я вчера поискал для интересу - и DDR3-1600 не нашел. -1333 - пожалуйста. Да и то не у нас, а в наших магазинах не нашел. Но по $20 за гигабайт, тогда как 4-гиговый модуль стоит $20-25 за 4.

Но. Вчера же был анонс от G.SKILL, у них 8-гиговые модули DDR3-2200 (или 2300, не запомнил). То есть массовое производство 1600-х тоже должно бы начаться.

BTW, если собирать систему с 32Gb, то LGA2011 может оказаться банально выгоднее по деньгам за счет дешевых модулей.

С выходом 1155 и соотв. процессоров старые АМД стали неинтересны, а новые ещё хуже старых по производительности каждого ядра (что на десктопе является ключевым).

Вот уж ради смены IDE-шнурков на SATA/SAS (еще и совместимых в одну сторону) - я готов потерпеть несовместимость!

так в них уже вроде пошла несовместимость.

Где? Ну кроме того, что SAS-диск не работает с SATA-контроллером.

sata, esata, sata ii, sata iii, micro sata, SLIMLINE "MINI" SATA, SATA2 Multilane 4x, eSATA "I", eSATA "L" ...

Из них половина просто совместима (собственно стандарты -1 -2 -3), а остальные - разновидности коннекторов, конверсия копеечными переходниками.

История примерно как с USB, коннекторов вагон, стандартов тоже уже 3, а жизни мешает весьма умеренно.

им только волю дай -- быстро уничтожат.
подожди-подожди, увидишь!

За год закончился 1156.
Через год точно так же закончат 1155, ну и что из этого ?

Покупается система плата-процессор-память-охладитель, потом она же меняется.
Если не маньячить, то нормально выбранной системы (если есть возможность добавлять память и диски) хватает на 3-4 года.
Если маньячить, то все равно обычно нужен новый сокет 8=-)

Про память fcenter тот же поспекулировал -- это, мол, из-за унификации с серверными чипами, которые должны всякие FB-DIBB и LR-DIMM поддерживать, что сложнее.

Графики вроде как не планируется -- опять же, серверные же кристаллы-то.

Хрен их разберет. Меня пугает, что 2 канала просто быстрее чем 4. То есть узкое место не в каналах, а еще где-то.

А графика - в наше время - это не для рисования голых баб, а для счета.

А для счёта у интела есть Лараби. Или уже нет? Да и так ли хороши интелловские GPU для счёта?

Лараби вроде уже того. Сейчас вместо него manycore (Intel MIC), которые вроде вот-вот будут (как и лараби) и вроде девелоперам уже что-то раздали. Но это, вроде бы, будут внешние карты.

А относительно "так ли хороши" - никто не знает т.к. в Sandy Bridge никакого нормального доступа (OpenCL, DX11) туда нет. А на OpenGL программировать вычислительные программы все уже давно бросили, ибо это только от бедности. Обещают, что в Ivy Bridge будет и DX11 и OpenCL.
Поэтому о производительности можно судить только по видеоэнкодеру/декодеру (интеловская библиотека, забыл название) и она там хорошая весьма.

Это интересно тем, что для подсчета не надо данные гонять туда-сюда т.е. простые вычислительные вещи (вроде суммы двух векторов) начинают иметь явный смысл.

Ну и вряд-ли Intel сделает сильно хуже AMD Fusion, а на старших Fusion это место, в теории, очень вкусное получилось, по плавучке раз в пять быстрее CPU.

По структурной схеме видео энк/дек делается на Сэнди Бридже (про Иви ещё не читал вообще) отедльными блоками, не программируемыми вовсе. И доступ к ним есть и энкодеры очень быстрые есть -- но, как я понимаю, ничего больше эти блоки (читай: DSP) не умеют, потому и API нет.

В-общем, в следующем поколении обещали OpenCL, ждать недолго осталось.

А сильно хуже fusion -- это легко. Всё же эта часть всё ещё ATI'шное наследие, а у Intel встроенная графика всегда отставала от конкурентов и заметно отставала.

А у конкурентов встроенной графики и не было. Были отдельные чипы.

Даааа? Была чипсетная. И у интела была чипсетная. И там всё было грустно. Дл интела.
Вообще, со времён i740, у Intel всё грустно с графикой, нет?

Так у кого кроме интела она была?

Эээ... У AMD разве не было чипсетов с графикой? А у nVidia, когда та вообще делала? А у ATI до продажи AMD? Вроде у всех были, нет?
AMD 6xx / 7xx были точно с графикой.

Да и позже:

AMD 890GX -- Integrated graphics: Radeon HD 4290...

Мне казалось, что integrated там - от системной памяти. А чип - отдельный.

Оно в северном мосту вроде как было... Или нет?

Кроме MIC есть ещё SCC - Single-chip Cloud Computer
http://iccs.lbl.gov/assets/docs/ICCS_2011_Talks/34%20Aparna%20Chandramow...

MIC вроде уже в серию почти пошел. А это чудо природы какое-то сильно экспериментальное.

Ну вот я припоминаю, что до 1366 всегда успевал несколько раз заменить горшок. Больше одного раза обычно. С 1366 так не вышло, с 1155 - наверное выйдет разок, хотя вот тоже PCIe-3 маячит.

Можно не маньячить, конечно. Вот у жены мак-мини который год (4-й, наверное или близко к этому), память два раза апгрейдил уже, диск на SSD поменяю - и еще надолго хватит.

а он у тебя core или core 2?

core2, 10.7 установилася без смены горшка.

Гы!
А я только собрался апгрейдить Q6600 на xeon W3530 (аналог i930).
Зато памяти будет 24 гига - при цене в 20 баксов за 4х гиговую DDR3-1600 было бы грехом не набить полностью.
Мне памяти только и нужно. 16ти гигов уже маловато, а других MB чтобы сравнительно дёшево набить больше 16ти уже нет.

у меня почти аналогичный случай. производительности правда не хватает.

Энивей, с какой бы точки пространственно-временного континуума не начал бы апгрейдиться, не важно в какой области, все равно будешь через n лет в жопе с движением дальше благодаря маркетологам. Да, давно уже не делают вещей всерьез и надолго. В компьютерах ладно, в фото - жалко.

А пофиг.
Я с Q6600 просидел с 2007 года просто увеличивая количество памяти.
Думаю, что и на новом компе ещё года 3-4 буду работать.

А в фото - у нас Сони А700 и А900 с кучей ещё минольтовской оптики нормально работают и не собираемся менять пока. Всё вполне устраивает.

А с фото то что? Ну кроме того, что маркетологи (и инженеры) находят путь к сердцу каждого и обновляются все добровольно.

Вроде никаких особых приколов последние лет 10 не было. Если не 20.

Ну в смысле, купить, например, сейчас ту же Fuji X100 с осознанием того, что вот-вот появится что-то новое и про эту Фуджи забудут, совсем не то же самое, что купить Leica M6 и забыть про смену камер на десятилетие-два, как раньше :)

Но она же продолжит снимать. А оптика там все едино несменная.

Не, есть риски с новыми байонетами (micro 4/3, sony nex и так далее) - эти все новые формы, по всей видимости, переходные и возможно будут забыты.

Вместе с тем, в ситуации когда достаточно популярная система снимается с производства есть масса хорошего, становится возможным подкупить себе (б/у) по очень льготным ценам. С продажей, да, проблема.

Для чего О_о? Производительность, она, штука такая относительная. Ее никогда не хватает. Вот, скажем, у меня тяжелая не настроенная грамотно по свету сцена визуализируется на 8 потоках 15 минут. А хотелось бы 10. А будет 10 - будет хотеться 5 ну и т.п. Это самое тяжелое. А сканы 4000 dpi 6х6 пока хватает ворочать :) Видео не обрабатываю.

Так заменить на 6ти ядерный?
Только искать не Core i7, а xeon. Народ не знает, что w3670 - это то же самое, что i970, поэтому xeon можно найти чуть дешевле.

у меня сканы 6х12, в 16 битном цвете, иногда когда из пары тройки собираешь панораму, то... очень долго.
Видео опять же.

А что тормозит то, фотошоп?

У фотошопа архитектура не менялась с прошлого века, скратч-файл он пишет всегда, и скратч-файлу важна линейная скорость записи и более ничего.

То есть берем 8-16-портовый SAS-контроллер, набиваем его маленькими Seagate Savvio 15k rpm (старые можно на eBay купить баксов по 20) и имеем счастье.
Или то же самое, но с мелкими (т.е. дешевыми) SSD.

Ну он пишет про 886Mb/sec.

Это 2-3 SSD (свежих) в страйпе. И несколько дешевле за гиг.

Да не - то понятно.
Просто как пример экстремального извращения ;) Он же там 2ю мать рядом включал чтобы получить 8 штук айрамов в системе.

А Геологу, IMHO, лучше набить памяти 48 гиг - если МБ позволяет втыкать 8ми гиговые диммы.
http://www.newegg.com/Product/Product.aspx?Item=N82E16820231485
Будет стоит 600 баксов, но всё разница будет заметней, чем любой быстрый скрэтч диск.

Жопа фотошопа в том, что скратч пишется всегда. То есть 48G RAM и рамдрайв гигабайт на 30 - спасут, конечно, но решение больно уж идиотское.

Спасибо за ссылку на память - я вчера 8-гиговики (из интереса) нашел только по $150-170.

> Жопа фотошопа в том, что скратч пишется всегда.

Он создаётся всегда (выделяется место на диске), но если памяти хватает, то не используется.
Можно включить индикатор эффективности, который показывает как часто использовался скрэтч (100% эффективность - вообще не использовался).
http://kb2.adobe.com/cps/404/kb404439.html#main_Keep%20an%20eye%20on%20t...

Ещё фигня в том, что в мемори сеттингах фотожопа стоит по умолчанию использовать 70% памяти. В 24х гигах я просто ставлю 100% и я ни разу не видел, чтобы efficiency падал ниже 100% при обработке нескольких сканов 6х6 (обычно 1 вся плёнка в 12 кадров).

> Спасибо за ссылку на память - я вчера 8-гиговики (из интереса) нашел только по $150-170.

Эх! У меня недавно приходил емыл с loyalty купонами от нового яйца, в том числе и на память, но я потёр за ненадобностью, т.к. везде все слоты забиты 4х гиговыми диммами - больше не нужно ;)

Новое яйцо мне без надобности - для большинства компьютерных железок (запчастей а не в сборе) разница в цене меньше чем стоимость пересылки.

То есть если есть 8-гиговики по 100, то скоро они у нас будут по столько же примерно.

А со скратчем - интересно. Я всерьез это место щупал давно, похоже там поменялось все в последних версиях. Ну или диски стали быстрее и я не вижу.

> А со скратчем - интересно. Я всерьез это место щупал давно, похоже там
> поменялось все в последних версиях. Ну или диски стали быстрее и я не вижу.

А оно всегда так было - если памяти хватает, то скрэтч не используется. И индикатор эффективности я помню ещё с 7го фотошопа.
Просто раньше оно было 32х-битное - 3гб макс, т.е. серьёзная работа всегда в память не умещалась.
С появлением 64х-битных версий и появлением памяти за копейки проблема скрэтч дисков должна уйти.
На 2011 должно быть хорошо - можно набить 64 гига относительно недорого.

64 - наверное да. И уже почти недорого, я тут летом приценивался к 128M на сервер - и удивлялся цене.

А вот на 16Gb - я взял скан 6x7 (4000dpi, 16 bit), буквально 3 минуты его покрутил готовыми actions - efficiency 11% увидел почти сразу. Ну, как только скратч до размера RAM дорос.

То есть ничего качественно не изменилось: историю долго не похранишь, только snapshot + purge, как и раньше. Да и то.

Одна радость, на 20-Mpix картинках эта проблема в 4 раза менее острая, чем на 85mpix

> А вот на 16Gb - я взял скан 6x7 (4000dpi, 16 bit), буквально 3 минуты его покрутил готовыми actions - efficiency 11% увидел почти сразу.

Интересно, что в этих actions? ;)
Да, у меня обработка довольно простая - кроп, цвет и курвы. Сложная возня потом с некоторыми поотдельности.
И потом обязательно пурж.

А как вариант для большого количества памти - есть МП с 18-ю слотами DDR3:
http://www.newegg.com/Product/ProductList.aspx?Submit=ENE&N=100007629%20...
Там регистровая память нужна, но вроде она не сильно дороже не регистровой:
http://www.newegg.com/Product/Product.aspx?Item=N82E16820148436
http://www.newegg.com/Product/Product.aspx?Item=N82E16820139141

Не, ну там много всего, естественно.

Можно PPw actions маргулисовские взять - оно тоже начинает быстро пухнуть на таких размерах.

А вот кстати, в эти которые dual 1366 под Xeon-ы 55-й серии, там простой рабоче-крестьянский i7 (первый) будет работать?

В сингл режиме вроде должен.
А вот в дуал - фиг. Оно же тем и отличается, что у 55й серии эти линии не вырезаны.

Про дуал - понятно.

Кстати, в однопроцессорном режиме будет работать только половина слотов памяти. Контроллер то теперь в процессоре - как у АМД.
В этом случае МП под оптероны и 16 слотов памяти выглядит лучше, т.к. оптероны дешевле стоят:
http://www.newegg.com/Product/Product.aspx?Item=N82E16813151221
http://www.newegg.com/Product/Product.aspx?Item=N82E16819105266

Вопрос возник по той причине, что i7 уже есть и я думаю, куда бы его применить, чтобы не так обидно было.

1U платформы с 2x1366 как-то совсем дешево стоят, практически по цене корпуса с 4x hotswap sata, вот я ж и думаю

Года 3 назад мы на таком примерно чуде кампутер собирали: http://www.tyan.com/product_board_detail.aspx?pid=271
Только чтобы иметь возможность набить 64 гига для фотошопа.

Socket 1366?

а зион становится? давно уже не работал на зионах

У меня вместо i930 нормально работает w3530 - надо теперь только запихнуть всё это в корпус и перенести систему.
Народ пишет, что в основном нормально работает. Бывают странные приколы из-за биоса.
А что за MB ?

Ну да.

И 5000-я серия под этот разъем есть. E5645 (6 ядер, 2.4Ghz) стоит, к примеру, очень гуманно.

Ну да.
Я свой w3530 недавно купил за $100 на ebay хотя i7 930 меньше чем за $160-170 не найти.

Отлично, значит будет Xeon следующим, когда приспичит.

Тут легко пропустить момент. Я вот c апгрейдом памяти у ноута (DDR2) еле успел, планки практически исчезли из продажи.

То есть надо мониторить внимательно наличие, снимут с производства и куку.

про тесты.
4 канала это полезно для многопоточных приложений. не факт, что однопоточное чтение/запись/копирование ускорится пропорционально.
обычно есть 2 режима - спаренный (ganged) и не спаренный (unganged). в первом случае адресное пространство чередуется через 64 байта между модулями, во втором, тоже чередуется, но шаг значительно больше (DRAM pagesize?). первый режим хорош для последовательного чтения, раньше он применялся почти всегда (128-битное чтение особенно хорошо для SSE). но на практике более важно иметь несколько независимых контроллеров памяти и соответственно несколько потоков на чтение/запись. AMD обычно всегда работает в независимом режиме.

А как это определить и можно-ли переключать?

в BIOS

Есть ли какой-нибудь софт который показывает настройки чипсета(ов)? Ведь это там задается.

Вот это, кстати, запросто. Теперь осталось найти такую систему и прогнать там свою бенчмарку.

Плюс, с copy есть приколы префетч-не префетч, запись movd/movnt и новые камни могут в этом смысле сильно отличаться.