Свежие комментарии

Title Comment
Вопрос по Эльбе: вы же

Вопрос по Эльбе: вы же платите налог с доходов?
Сколько "Учитывать в налогах" вы ставите для списаний? Всю сумму или 0.00?
Я пока ставлю 0.00.
Моёдело в этом месте само автоматом использует 'не "Учитывать в УСН"'

Хорошая новость -

Хорошая новость - спасибо

Бочка меда: но исходник kernel можно генерировать на лету и прямо на рантайме его скомпилируют. А можно хранить скомпилированный и тогда вышеупомянутые 110msec не потратятся.

note: "скомпилированный" - можно генерировать тем же рантаймом

На русском, как мне кажется,

На русском, как мне кажется, вообще ничего нет.
Если дружны с CUDA, то есть AMD-шный гайд по преобразованию из CUDA в OpenCL.

А в остальном
- документация соответствующих SDK (Nvidia, AMD, Intel, IBM)
- примеры оттуда же
- официальные спеки от Khronos Group

У NV есть 'OpenCL Jumpstart Guide' на 15 страницах. Ну и по 'OpenCL getting started' гугл много нашел.

Книжки всякие уже есть, но пиратки я пока не нашел, а покупать как-то обидно :).

А не подскажите толковой

А не подскажите толковой литературы по OpenCL?
С английским дружу, но лучше на русском и в открытом доступе =)

Там в каментах "все как один"

Там в каментах "все как один" пишут - вынесите на SSD те места, которые пишутся (profiles, TMP) и увидите разницу именно в response.

Я поддерживаю.

Ветвления - да, с ними сексуально в SIMD.

Ветвления - да, с ними сексуально в SIMD.

А я вчера в рамках изучения

А я вчера в рамках изучения скорости запуска ворда - забутил вторую машину, которая для удаленной отладки и всяких подобных приключений. На 500-гиговом SATA.

Это адъ, я на ней работать не хочу. И именно по причине всяких секундных, трехсекундных и т.п. задержек. Пока visual studio открывает проект - и чаю не успеешь попить и тупо сидишь фтыкаешь

Ну тут бы правильно включить HT, потом выключить HT. Потому

Ну тут бы правильно включить HT, потом выключить HT.

Потому как непонятно какие ожидания попрятаны, но лично я ставлю на IO в первую очередь

> в hyperthreading я не очень верю ХЗ На 4х головом i7 комп

> в hyperthreading я не очень верю

ХЗ
На 4х головом i7 компиляция http://svn.webkit.org/repository/webkit/trunk/ c -j4 - порядка 18 минут, с -j8 чуть больше 12 минут, а самый быстрый вариант с -j12 - около 11 минут.

> Ну то есть да, программировать надо, но никакого секса с о

> Ну то есть да, программировать надо, но никакого секса с определением "вот эти вот - не взаимозависимы, можно параллелить" - нет

Есть. Вот совсем без секса - это то, как было в Intel OpenCL Alpha. Любой if - и все, никакой векторизации ядра. В Beta явно видно, что инженеры Интел постарались. Впрочем, там явно видно, что есть куда еще улучшать.

Вот другое мнение:

Вот другое мнение: http://www.fclab.ru/2011/06/20/2653/
Мне как-то ближе второе.

Я в компиляторах понимаю мало, но из общих соображений - это

Я в компиляторах понимаю мало, но из общих соображений - это не бог весть какая задача.
OpenCL устроен так, спасибо NVidia, что для скалярных типов несколько work items можно смело на одном SIMD произвольной ширины исполнять. Ну разве что следить, чтобы на хвосте задачи, где на всю ширину не хватает данных, не было какой-то гадкой гадости.

Ну то есть да, программировать надо, но никакого секса с определением "вот эти вот - не взаимозависимы, можно параллелить" - нету, items по определению независимы и порядок исполнения (групп) не определен, делай что хочешь. Скажем нвидии спасибо еще раз.

Впрочем, посмотрел. Хреново векторизовал. Понятно откуда с

Впрочем, посмотрел.

Хреново векторизовал. Понятно откуда столько разницы.

Но у интела то векторизация не внутри кода кода, а посредств

Но у интела то векторизация не внутри кода кода, а посредством объединения нескольких work-items. Если в LLVM что и есть на тему векторизации, то здесь оно никак помочь не может.

Да, прошу прощения, руки за мыслями не поспевают.

Да, прошу прощения, руки за мыслями не поспевают.

Мне казалось, что для LLVM это (векторизация) как-то уже ест

Мне казалось, что для LLVM это (векторизация) как-то уже есть, что-то я такое видел (правда с векторными типами т.е. это еще проще для компилятора).

Это помимо помянутого выше ipsc, который тоже векторизует и вполне неплохо (и диалект C тамошний на OpenCL достаточно похож). Может быть ipsc - это отход от производства OpenCL, конечно.

Пока отвечал - вы отредактировали. Интеловский компилятор т

Пока отвечал - вы отредактировали.

Интеловский компилятор тоже векторизовать умеет. Хотя сделал ли он это в данном случае достаточно хорошо - вопрос, который лень изучать.

Важно то, что OpenCL для того же самого кода - векторизовал с виду неплохо.

Ну чтобы векторизовать, надо думать, код писать. Не так ведь

Ну чтобы векторизовать, надо думать, код писать. Не так ведь просто. Интел в это вложился, ибо деваться некуда, да.

О да. AMD-шная для (интеловских?) CPU явно сделана для галоч

О да. AMD-шная для (интеловских?) CPU явно сделана для галочки.

Хотя внутре у них у всех LLVM, с чего бы не векторизовать то...

И он, кстати, поумнее AMD-шной реализации. Векторизовать уме

И он, кстати, поумнее AMD-шной реализации. Векторизовать умеет.

Смотрел, но пока не готов вербализовать. Сделаю тестовую зад

Смотрел, но пока не готов вербализовать. Сделаю тестовую задачку на выходных - вербализую.

У OpenCL сплошные плюсы для моих надобностей, с единственным но существенным минусом (временным) - пока интеловскую версию невозможно использовать в end-юзерских программах т.к. йузер должен сам скачать и поставить этот варез.

А на ipsc того же афтара (Интел) ты не смотрел? Они там пере

А на ipsc того же афтара (Интел) ты не смотрел? Они там переизобрели язык С.

Ага, в году семь 31-дневных

Ага, в году семь 31-дневных месяцев, что покрывает февральское проседание.
Надо только теперь это дело автоматизировать + использовать счёт в их же банке, чтобы комиссию за переводы не брали..

Ага. Поэтому надо требовать

Ага. Поэтому надо требовать возмещения за 31-дневный месяц!

хотя не, цены ведь за месяц

хотя не, цены ведь за месяц

Афёра

https://www.moedelo.org/Pays/RefundPolicy.aspx
Мы возместим вам 1/30-ю стоимости тарифа за каждый неиспользованный вами день.

Учитывая то, что минимальный тариф у них год, то получается 365*3840р/30=46720р
Афёра, однако

ну тогда SSD - шаг к изобретению оперативной памяти, не теря

ну тогда SSD - шаг к изобретению оперативной памяти, не теряющей информации при отключении питания.

С записью - вопросов нет, сериализация может быть полезной,

С записью - вопросов нет, сериализация может быть полезной, а накопление и переупорядочение - без вопросов полезно. Хотя мои эксперименты с gjournal дали какие-то печальные результаты, но это было давно, я с тех пор сполз на ZFS и счастлив с ней.

А вот с чтением, ну да, префетч наверное рулит - если вы собираетесь из этого места читать дальше. Но в случае random IO - нет, не собираюсь.

geom_cache читает с носителя блоками не менее чем ему задано

geom_cache читает с носителя блоками не менее чем ему задано, я ставлю MAXPHYS (128K), плюс кеширует. Для рейдов, которые разбивают запрос на N частей и читают каждую часть с отдельных дисков в параллель, можно поверх поставить gcache с N-кратным размером страйпа, чтобы к дискам уходили не мелкие запросы на чтение, а крупные.

geom_journal пишет данные в журнал линейно, раскидывая их потом по диску уже позже и асинхронно. Для кучи мелких записей производительность сильно увеличивается, для длинной линейной записи вдвое уменьшается (сначала запись в журнал, потом из журнала на fs).

Ну за тем исключением, что при пропадании питания будет сюрп

Ну за тем исключением, что при пропадании питания будет сюрприз.

Только вот DDR3 стоит ~$50 за 4Gb, а флэша на эти деньги можно купить примерно 20Gb.

Pages

Subscribe to comments_recent_new