Свежие комментарии

Title Comment
Kaby Lake.

Kaby Lake.
В колонке - при каком анализе? Я все стандартные попробовал - нет колонки, надо вероятно настраивать.

Амплифаейр - свежий. 2018-й

Это на Haswell исполняется?

Это на Haswell исполняется? split loads - в backend/cache/L1 колонке.

А SSE-случай - не memory

А SSE-случай - не memory bound.

Я не очень понимаю где/как

Я не очень понимаю где/как это там смотреть.

Вот зато там есть memory access профайлинг - и таки да, интересные мне инструкции 'memory bound' (еще, конечно, гистограмма сильно тормозит - но этим не удивить)

Ну я вижу тотальное

Ну я вижу тотальное замедление (в 2 секунды CPU time на 24 примера, т.е. ~10msec wall time на файл) - и оставлю SSE вариант пока.

Но вообще вот результаты профайлинга amplifier у меня особых вопросов не вызывают как правило, похоже на правду ж все

Это называется sampling, и он

Это называется sampling, и он biased довольно здорово, причём biased по-разному в зависимости от команд и их последовательностей и как они поделились на пачки при сабмите в ядро процессора. Это большое исскуство читать вывод семплинг-профайлера.

Может статистически смотрит

Может статистически смотрит (а куды мы попали то)?

load/store - вдвое меньше,

load/store - вдвое меньше, естественно.
Арифметики плавучей - ну тоже (4 операции на юнит из 1/2 пикселей соответственно)
reordering: SSE 7 команд на 4 выходных пикселя, AVX: 12 команд на 8 пикселей. Потому что float3->float4 не вполне тривиальная операция.

Да, и давай я всё же уточню:

Да, и давай я всё же уточню: AVX-команд вдвое меньше чем SSE? Т.е. объём данных прокачивается строго одинаковый и разница в скорости между 2*N командами SSE (по 128 бит) и N командами AVX (по 256 бит)?

Кстати, знакомый, который

Кстати, знакомый, который много профилирует с помощью PMC, недоумевает как Амплифаер показывает тормоза на загрузке. Он говорит, что PMC не позволяют такой результат получить достоверно.

А cache line splits amplifier

А cache line splits amplifier не показывает во втором случае? (плюс выше уже написали про включение AVX и частоту.)

P.S. Оно там все слезы на

P.S. Оно там все слезы на фоне декодирования float-данных, но разобраться и понять очень бы хотелось конечно

Не, ну вот смотри, есть два

Не, ну вот смотри, есть два набора файлов, примерно одинакового размера, 24 linear DNG в плавучке, 3 компонента на пиксель и еще 24 - таких же, но 4 компонента на пиксель. Отличаются деталями (fp16/fp24/fp32, черный вычтен/не вычтен, есть scale в 0-1 или нету), это я из двух исходников наклонировал.

И вот значит float4 во внутреннее представление (тоже float4) - AVX быстрее. float3->float4 - AVX медленнее. Ну ладно, я бы даже и согласился бы (там float3->float4 не такой простой код), но
а) Amplifier показывает тормоза на чтении данных (и вроде как не должен провираться)
б) int3 -> float4 - работает нормально, хотя там код еще сложнее и регистров надо еще больше (но, понятно входных данных самих меньше - и может быть потому оно не проявляется)

Блок включается какие-то

Блок включается какие-то сотни тысяч тактов. потом довольно быстро (но не рсазу) выключается. Плюс после включения блока процессор снижает частоту если был в турбобусте. Причём, как я понимаю, существенно (но зависит от кокнретной модели).

А какие именно спецэффекты то

А какие именно спецэффекты то?
_mm256_zeroall() по выходу из AVX-кода - делаю.

А ты учитываешь все

А ты учитываешь все спецэффекты от AVX2?

Спасибо!

Спасибо!

"Мы уже букву К нарисовали"

спеллинг кстати поправьте - а

спеллинг кстати поправьте - а то "No Preview Availible" у вас.

Нет ли записной книжки

Нет ли записной книжки получше??

Комментарии к записи закрыл.

это я для памяти откладываю

это я для памяти откладываю здесь в комментариях... никуда писать не надо... проблемы была почему сгенерированный DNG открывается в ACR/LR с "Image Settings" вместо "Camera Raw Defaults" при условии отсутствия .xmp sidecar (или экв в ACR/LR database) - ответ пишите/непишите xmp:crs тэги внутри DNG

Если вы хотите, чтобы мы что

Если вы хотите, чтобы мы что-то куда-то писали (или, наоборот, не писали) - пишите прямо, а не загадками.

отложу немного порошка и

отложу немного порошка и здесь:

"...In general, the presence of these tags will trigger ACR to open the file as "Image Settings" (not Camera Raw Defaults), as long as the crs:AlreadyApplied tag is set to False. For most raw files that you edit (e.g., adjust sliders in ACR and click Done), this will be the case...

Eric Chan"

все гениальное просто и

все гениальное просто и налицо, надо было просто посмотреть на экран ... при определенных настройках UI X-Transformer'а Брайан Иридентович в DNG пишет xmp:crs:... ну и ACR видя такое дело "camera raw defaults" не применяeт... новичок послал в калифорнию мылом.

непонятно где именно то что

непонятно где именно то что мешает ACR применить camera raw defaults в его случае... понятно что элементарные вещи типа Make & Model & UniqueCameraModel такие же как и сам Adobe пишет 1:1... но где-то чего-то не хватает или не то записано.

У нас *не* работает автоматом

У нас *не* работает автоматом только Lens profile, потому что мы не знаем что туда писать. О чем написано выше.

Все остальные теги - такие же как у adobe-generated DNG, включая даже и DNGPrivate.

не поленился = ну вот у вас

хотя нет - у вас работает, у него не работает... будем смотреть дальше :-)

C конца:

C конца:
- DPP поди не жрет DNG?
- откуда в RPP превьюшки?

(про сохранение настроек внутрь DNG интересно, при случае гляну)

ARQ файлы вроде имеются в

ARQ файлы вроде имеются в количестве в интернете.

я бы рад - где взять raw для

я бы рад - где взять raw для эксперимента ? вопрос ес-но не про A7R3 - а про генерацию вами DNG и тэгов в нем

Понятия не имею. Пробуйте.

Понятия не имею. Пробуйте.

Pages

Subscribe to comments_recent_new