Было (это результат профайлера, разложенный по тредам):
Через два дня работы и ~800 строк кода стало (естественно, на тех же параметрах и входных данных):
Реально постобработка маленьких картинок ускорилась в 6 раз, больших - в 4. Почему маленькие быстрее - Х.З. Может быть кэши рулят. Это без учета распаковки, которая в профиль включена (и, увы, она для LJPEG не параллелится, если оный LJPEG не порезан на кусочки, как в DNG).
Имею сказать: