Свежие комментарии
Title | Comment |
---|---|
В очень пессимистичном случае нужно заполнить все 2 МБ L2 кэ |
В очень пессимистичном случае нужно заполнить все 2 МБ L2 кэша (16кб L1 можно пренебречь), тогда данные берём из L3 (задержка доступа 30 тактов); предположим что читаются они по 4 байта, и все чтения зависимые. Тогда нужно 2*1024*1024 / 4 * 30 тактов чтобы запонить L2. На FX 8120 (самом медленном по частоте из нынешних FX-ов) обычная (не Turbo Boost) частота составляет 3.1 ГГц, и т.о. заполнение кэша займёт 5 мс. Если планировщик перекидывает потоки не очень часто (скажем, раз в секунду), и выделение отдельного FPU каждому потоку ускоряет программу хотя бы 0.5% имеет смысл переносить поток на отдельный модуль. |
От AMD было много хорошего |
От AMD было много хорошего принесено. Но конкретно бульдозеры - сомнительные какие-то. |
Ну я про профайлинг думал, когда писал. Но получается тоже |
Ну я про профайлинг думал, когда писал. Но получается тоже как-то некрасиво. Вот допустим у меня есть два потока, в которых точечные вкрапления SSE-математики. |
А вот у меня плата, через 9 |
А вот у меня плата, через 9 лет, с двумя оптеронами подохла, теперь сижу на ноутбуке, жду бульдозеров, процессор у ноутбука раза в три быстрее, и памяти 6 гигов, а сам он работает раза в три медленнее, вот сижу и страдаю, а на старой машине и память меделенная и винты не ах. В общем это как газель против жигулей или даже феррари, как 6 кубов сороковки надо перевезти так и задумаешся. На ксеонах очень дорого получается и апгрэйт не возможен. Ну и в защиту АМД (хотя мне брэнды по барабану) 64 бит она заставила сделать, контроллер памяти она заставила сделать, за энегрго сбережение, ей спасибо, за нормальные шины котрые из процессора торчат тоже ей :-) |
<blockquote>Вместе с тем, планировщик потоков должен еще зна |
Внезапно...LWP! |
Мне кажется это инженеры AMD сначала решили запилить наконец |
Мне кажется это инженеры AMD сначала решили запилить наконец-таки HT, только лучше чем у Интела, а потом маркетологи решили обозвать каждый поток исполнения ядром. |
В серверах буль должен как раз нормально себя показать (если |
В серверах буль должен как раз нормально себя показать (если сервер не для HPC). 16 потоков бульдозера в целочисленных задачах будут ощущаться как 16 ядер, а лимит в 2 IPC для PHP/Java кода всё равно недосягаем |
сложно назвать эти обрезки " честными x86 ядрами" А тк. в и |
сложно назвать эти обрезки " честными x86 ядрами" ну посмотрите на сравнение с 6ти ядрёными i7 900-й серии , с 4х ядрёным i7-2600. |
не надо сравнивать HT с чесными x86 ядрами, которыми являютс |
не надо сравнивать HT с чесными x86 ядрами, которыми являются ядра Бульдозера. |
Принципиальное отличие APU в том, что оно работает на той же |
Принципиальное отличие APU в том, что оно работает на той же памяти. А внешней карте надо переслать данные туда (по PCIe), а потом забрать результаты. А в той же памяти, да еще если Zero-copy - очень даже осмысленно. Ну вот для A8-3800 прикидка по FP/single: 240Gflops - это, приблизительно, текущий 12-ядерный magny-cours на 2.33, 6180. Т.е. потенциал у штуки есть, другой вопрос что оно пока недоделаное сильно, поддержки double нет, поддержка zero copy какая-то невнятная (или пресс-релиз про нее был невнятный), но к чему это дело применить - вполне есть. |
Ну да - но гораздо интеллектуальнее! |
Ну да - но гораздо интеллектуальнее! |
напоминает проверку хлопушек. |
напоминает проверку хлопушек. |
А кому на практике хорошо от этой благородной идеи ? +полт |
А кому на практике хорошо от этой благородной идеи ? Да кто ж спорит, Оптероны ещё недавно были хороши. Кстати, все разы, что я пытался рассматривать их как вариант для покупаемого сервера, они пролетали с треском - предложение серверов с ними на рынке Украины очень скудное (манагерам АМД недосуг шевелиться). >>программировать под него явно надо иначе, А вот этим почти никто не будет заниматься. Именно потому, что нахрен не нужно. |
Из ATI получился APU, что само по себе - очень благородная и |
Из ATI получился APU, что само по себе - очень благородная идея. Хотя по дороге случился бардак с CTM-CAL/IL-а что будет в HD7xx вообще непонятно. Что касается остального, то я тут в августе-сентябре поимел дело с оптеронами и мне понравилось. Точнее, смотря на десктопы - я проецировал это на сервера и на серверах ожидал худшего. А тут - бульдозер этот, с которым неясно что делать, программировать под него явно надо иначе, а нахрена если есть более прямолинейный интел? |
Они же поверх системных библиотек сидят. А библиотекам - акт |
Они же поверх системных библиотек сидят. А библиотекам - актуально. |
Так-то оно так, да вот загвоздка - Java (по факту) прек |
Так-то оно так, да вот загвоздка - Java (по факту) прекрасно себя чувствует на интелёвых многоядерниках с НТ. |
Смешно. Опять же - может, вместо игр с миллиардами денег |
Смешно. Опять же - может, вместо игр с миллиардами денег на покупку Ати и потом на разделение компаний ( ++лярды затрат, ++директора и манагеры) надо было толковых инженеров покупать ? Интел свою ошибку осознал где-то в 2003-05 гг. Сначала в мобильном сегменте (там Пню4 вообще было нечего ловить), а потом и в остальных. Кстати, я в своем Коре выключил нафиг энергосбережение (с1-с6), потому как цепи питания еле слышно свистят при вкл-выкл ядер (у меня хороший слух, в тишине слышно.) |
согласен. но не думаю, что для Java и PHP это всё актуально. |
согласен. но не думаю, что для Java и PHP это всё актуально. |
Ну да, может быть и манагеры. В Арстехнике еще ссылаются на |
Ну да, может быть и манагеры. В Арстехнике еще ссылаются на то, что раньше какие-то блоки руками разводили, а сейчас полный автомат, который на 20% хуже. |
FPU/SSE внезапно вылезает в memmove. Или в AES/CRC32. Не гов |
FPU/SSE внезапно вылезает в memmove. Или в AES/CRC32. Не говоря о кодировании видео и многом тому подобном. То есть грабля может ударить из совершенно неожиданного угла. |
я тоже разочарован и писал по этому поводу. думаю никакой бо |
я тоже разочарован и писал по этому поводу. думаю никакой большой идеи не было, просто хотелось как-то ответить на HT у Intel, чтобы догнать и перегнать по кол-ву потоков на процессор. |
_было_ неплохо . Новые ядра медленные старых , Феномовски |
_было_ неплохо . Новые ядра медленные старых , Феномовских. |
его на большинстве задач 4х ядрёный Коре 2400-2500 обходит, |
его на большинстве задач 4х ядрёный Коре 2400-2500 обходит, какие там 6ти ядерники... |
Почему бардак ? Манагеры АМД поставили задачу - сделать |
Почему бардак ? >>А у нового - 4 юнита, но два из них целочисленные, а два - плавучка. Судя по результатам тестов, на плавающей оно более-менее сравнимо с 4х ядрёным Коре. |
Ну меня серверные интересовали. А там у AMD с 12-ю я<s>йц</ |
Ну меня серверные интересовали. А там у AMD с 12-ю я |
http://www.guru3d.com/article/amd-fx-8150--8120-6100-and-410 |
http://www.guru3d.com/article/amd-fx-8150--8120-6100-and-4100-performanc... в общем i7-980 рвёт топового бульдозера как тузик грелку |
можно было бы и точнее, наверное, взвесить. они правильные |
можно было бы и точнее, наверное, взвесить. они правильные -- когда аа клал, то немножко разный вес показывали, т.е. можно осмысленно усреднить результаты нескольких измерений. |
Реально круто! И то что я купил за $50 (судя по eBay-ским ц |
Реально круто! И то что я купил за $50 (судя по eBay-ским ценам, половину стоят гири) - тоже дает разброс порядка 0.01% (две гири по 100.0, в сумме 198.98), что тоже меня поразило. Лет 8 назад я весы до 200г с делением 0.01 и реальной точностью 0.03 покупал евров за 300. У них, правда, сертификат был, а у китайцев этих с надписью made in USA - нету. |
взял 4 батарейки ааа и две аа. 23 23 11 12 12 12 кучкой 93 |
взял 4 батарейки ааа и две аа. кучкой 93 прям сейчас такие весы продаются за 170. |
Получается, что даже если мы |
Получается, что даже если мы знаем внутреннее сопротивление идеальной батарейки из данной партии, а потом измерили у конкретной - то что-то разумное можно оценить только на последних 10% разряда. У меня пока получается, что правильная метрика - это напряжение под нагрузкой или сразу после снятия нагрузки (в течение 1-2 минут). Если вынуть-подождать, то напряжение восстанавливается и разряженную на 60% от разряженной на 100 - не отличить. Ну или на сопротивлении в 2-5 ом нагружать - и тогда "сразу все понятно", где бы его взять бы, ни одной радиодетали дома... |
Pages
