Свежие комментарии

Title Comment
Intel TBB клевый.

Intel TBB клевый.

http://www.gpgpu.ru/node/933#comment-3087

фишка в том, что сложный код пишется один раз, и выносится в библиотеки, типа TBB.

Кстати, а как там с exception's из thread'ов?

Оно посчитано: есть графики загрузки по core. Но вот проинте

Оно посчитано: есть графики загрузки по core.
Но вот проинтегрировать по этим графикам я не умею. Так, на глазок, суммарная загрузка там где 8 threads работают - процентов 60. Но это для HT (SMT), что это на самом деле значит - для меня не вполне понятно.

А ради интереса - именно CPU time замерить возможно?

А ради интереса - именно CPU time замерить возможно?

Это чистое время (wall clock), а не CPU time. Т.е. если како

Это чистое время (wall clock), а не CPU time. Т.е. если какое-то ядро ждет соседей в состоянии idle - на графике это тоже считается.
Но, конечно, накладные расходы есть:
- на синхронизации между потоками
- на reduce т.е. на объединении результатов расчетов в параллель (скажем, для гистограммы).

Что касается десктопа/сервера, то достаточно легко представить случай, когда рулит и на сервере тоже. Ну, например, обработка одного "запроса" в параллель влезает в кэш (L2 или L3), а 16 или 32 запроса (по числу ядер) - туда не влезают и вынуждены работать с памятью. Аналогично с диском (но тут просто выигрыш от сериализации)

ZIL же!

ZIL же!

Хм. Для десктопа рулит. Но вообще любопытно - вместо 11.8сек

Хм. Для десктопа рулит. Но вообще любопытно - вместо 11.8сек было съедено суммарно 18.8сек. Ничо так накладные расходы. Или я неправильно считаю?

В совсем чистом рафинированном случае на 4 горшках получаетс

В совсем чистом рафинированном случае на 4 горшках получается ~4 раза, как и должно быть. Если в память не уперто.

а, это SMT. это как минимум улучшенные HT. может почти насто

а, это SMT. это как минимум улучшенные HT. может почти настоящие.
а сколько разов получается вместо 6, если их запретить?

Я в них не разбираюсь. Но наверное новый, процессор то новы

Я в них не разбираюсь.

Но наверное новый, процессор то новый (i7-2600)

так какой ht? старый или новый (который SMT)?

так какой ht?
старый или новый (который SMT)?

4 ядра, HT можно выключить/включить (я делал в BIOS, c affin

4 ядра, HT можно выключить/включить (я делал в BIOS, c affinity не развлекался). 8 потоков быстрее 4-х.
Делал это на целочисленной части, с плавучкой - не делал.

гипертрениг или smt? а клевый когда у тебя есть float или вс

гипертрениг или smt?
а клевый когда у тебя есть float или всегда?

Непосредственно в программе,

Непосредственно в программе, quick view у меня выключен

А это в быстром просмотре,

А это в быстром просмотре, или непосредственно в программе?
Там просто разные алгоритмы, хз, как она там файлы обрабатывает))

Я поэтому и отказался сейчас от эсидиси - слишком много в ней странностей. FastStone как-то попроще/надёжнее/шустрее выглядит.

Уже неактуально.

Уже неактуально.

EP2 можно продать на сайте

EP2 можно продать на сайте http://olympus.ourlife.ru/forum/
В разделе барахолка.

Согласно википедии, в современных процессорах (начиная с Cor

Согласно википедии, в современных процессорах (начиная с Core2 примерно) - оно не плавает.

Т.к. мне надо для внутрениих тестов, а у меня младше Core2 и нету ничего - то вроде все нормально.

ну вот это может быть как раз тот самый случай, который вы х

ну вот это может быть как раз тот самый случай,
который вы хотели - вам отдают не счётчик прерываний таймера,
а какой-нибудь TSC с разрешением намного выше таймерного.

вот тут и надо измерить для проверки.

а вот что делать будете, если процессор частоту занижает для экономии? TSC тоже должен поплыть...

Ну и resolution info - тоже в секундах-наносекундах. Вот н

Ну и resolution info - тоже в секундах-наносекундах.

Вот на первой попавшейся под руку FreeBSD-шной машине - говорит что 103nsec разрешение (~10Mhz). Что, конечно, довольно удивительно т.к. ядро рассказывает о 14-Mhz HPET-таймере и 3.6Mhz ACPI-таймере.

а толку-то? это только единицы, в которых время отдаётся, эт

а толку-то? это только единицы, в которых время отдаётся,
это ещё не значит, что там реально наносекунды.
так можно и 100-герцовый таймер отдать, пересчитав в фемтосекунды, например.

Согласно ману, clock_gettime дает сразу в секундах-наносекун

Согласно ману, clock_gettime дает сразу в секундах-наносекундах, делить-умножать не надо.

я правильно вас понял, что clock_getres выдаст нам период в

я правильно вас понял, что clock_getres выдаст нам период в наносекундах?

"The function clock_getres() finds the resolution (precision) of the specified clock"

вопрос-то был, как узнать частоту (период) получаемого счётчика.
из мана это как-то не очень понятно.

Хм

$ cat /sys/devices/system/clocksource/clocksource0/current_clocksource
tsc

Значит-ли это, что если в /sys/devices/system/clocksource/clocksource0/available_clocksource просматривается hpet, лучше его и использовать?

Включал GPU и parallel loading. Иначе нет смысла :)

Включал GPU и parallel loading.

Иначе нет смысла :)

на всякий случай - === cut === FastPictureViewer ships in a

на всякий случай -
=== cut ===
FastPictureViewer ships in a kind of 'safe mode' where hardware acceleration, parallel image loading and smooth scaling are turned off by default. You might want to try turning those features ON one by one from the Options dialog and experiment a little bit with the settings to discover what works best for your computer and your needs. The fastest configuration is described in the FAQ.
=== cut ===
это включал ?

Очевидно. И мой поинт - выделен болдом в посте, тут, выше.

Очевидно.
И мой поинт - выделен болдом в посте, тут, выше.

Ну чудес-то не бывает. Очевидно, где-то закэшировалась непра

Ну чудес-то не бывает. Очевидно, где-то закэшировалась неправильная картинка

Он реально фаст, но за счет префетча. А вот дропая в него с

Он реально фаст, но за счет префетча.

А вот дропая в него случайные картинки (из фолдера с большим количеством оных) - я его как-то быстро смутил.
Не, не получат они мою тридцатку.

Fast Picture Viewer - очень быстрый. Я даже купил его. www.

Fast Picture Viewer - очень быстрый. Я даже купил его.
www.fastpictureviewer.com

Для бенчмарков удобно

Для бенчмарков удобно http://doc.trolltech.com/main-snapshot/qtestlib-tutorial5.html . Если тест быстро выполнился он его в цикле покрутит. Ну и мультиплатформ опять же.

Pages

Subscribe to comments_recent_new