Свежие комментарии
Title | Comment |
---|---|
Вопрос по Эльбе: вы же |
Вопрос по Эльбе: вы же платите налог с доходов? |
Хорошая новость - |
Хорошая новость - спасибо Бочка меда: но исходник kernel можно генерировать на лету и прямо на рантайме его скомпилируют. А можно хранить скомпилированный и тогда вышеупомянутые 110msec не потратятся. |
На русском, как мне кажется, |
На русском, как мне кажется, вообще ничего нет. А в остальном У NV есть 'OpenCL Jumpstart Guide' на 15 страницах. Ну и по 'OpenCL getting started' гугл много нашел. Книжки всякие уже есть, но пиратки я пока не нашел, а покупать как-то обидно :). |
А не подскажите толковой |
А не подскажите толковой литературы по OpenCL? |
Там в каментах "все как один" |
Там в каментах "все как один" пишут - вынесите на SSD те места, которые пишутся (profiles, TMP) и увидите разницу именно в response. Я поддерживаю. |
Ветвления - да, с ними сексуально в SIMD. |
Ветвления - да, с ними сексуально в SIMD. |
А я вчера в рамках изучения |
А я вчера в рамках изучения скорости запуска ворда - забутил вторую машину, которая для удаленной отладки и всяких подобных приключений. На 500-гиговом SATA. Это адъ, я на ней работать не хочу. И именно по причине всяких секундных, трехсекундных и т.п. задержек. Пока visual studio открывает проект - и чаю не успеешь попить и тупо сидишь фтыкаешь |
Ну тут бы правильно включить HT, потом выключить HT. Потому |
Ну тут бы правильно включить HT, потом выключить HT. Потому как непонятно какие ожидания попрятаны, но лично я ставлю на IO в первую очередь |
> в hyperthreading я не очень верю ХЗ На 4х головом i7 комп |
> в hyperthreading я не очень верю ХЗ |
> Ну то есть да, программировать надо, но никакого секса с о |
> Ну то есть да, программировать надо, но никакого секса с определением "вот эти вот - не взаимозависимы, можно параллелить" - нет Есть. Вот совсем без секса - это то, как было в Intel OpenCL Alpha. Любой if - и все, никакой векторизации ядра. В Beta явно видно, что инженеры Интел постарались. Впрочем, там явно видно, что есть куда еще улучшать. |
Вот другое мнение: |
Вот другое мнение: http://www.fclab.ru/2011/06/20/2653/ |
Я в компиляторах понимаю мало, но из общих соображений - это |
Я в компиляторах понимаю мало, но из общих соображений - это не бог весть какая задача. Ну то есть да, программировать надо, но никакого секса с определением "вот эти вот - не взаимозависимы, можно параллелить" - нету, items по определению независимы и порядок исполнения (групп) не определен, делай что хочешь. Скажем нвидии спасибо еще раз. |
Впрочем, посмотрел. Хреново векторизовал. Понятно откуда с |
Впрочем, посмотрел. Хреново векторизовал. Понятно откуда столько разницы. |
Но у интела то векторизация не внутри кода кода, а посредств |
Но у интела то векторизация не внутри кода кода, а посредством объединения нескольких work-items. Если в LLVM что и есть на тему векторизации, то здесь оно никак помочь не может. |
Да, прошу прощения, руки за мыслями не поспевают. |
Да, прошу прощения, руки за мыслями не поспевают. |
Мне казалось, что для LLVM это (векторизация) как-то уже ест |
Мне казалось, что для LLVM это (векторизация) как-то уже есть, что-то я такое видел (правда с векторными типами т.е. это еще проще для компилятора). Это помимо помянутого выше ipsc, который тоже векторизует и вполне неплохо (и диалект C тамошний на OpenCL достаточно похож). Может быть ipsc - это отход от производства OpenCL, конечно. |
Пока отвечал - вы отредактировали. Интеловский компилятор т |
Пока отвечал - вы отредактировали. Интеловский компилятор тоже векторизовать умеет. Хотя сделал ли он это в данном случае достаточно хорошо - вопрос, который лень изучать. Важно то, что OpenCL для того же самого кода - векторизовал с виду неплохо. |
Ну чтобы векторизовать, надо думать, код писать. Не так ведь |
Ну чтобы векторизовать, надо думать, код писать. Не так ведь просто. Интел в это вложился, ибо деваться некуда, да. |
О да. AMD-шная для (интеловских?) CPU явно сделана для галоч |
О да. AMD-шная для (интеловских?) CPU явно сделана для галочки. Хотя внутре у них у всех LLVM, с чего бы не векторизовать то... |
И он, кстати, поумнее AMD-шной реализации. Векторизовать уме |
И он, кстати, поумнее AMD-шной реализации. Векторизовать умеет. |
Смотрел, но пока не готов вербализовать. Сделаю тестовую зад |
Смотрел, но пока не готов вербализовать. Сделаю тестовую задачку на выходных - вербализую. У OpenCL сплошные плюсы для моих надобностей, с единственным но существенным минусом (временным) - пока интеловскую версию невозможно использовать в end-юзерских программах т.к. йузер должен сам скачать и поставить этот варез. |
А на ipsc того же афтара (Интел) ты не смотрел? Они там пере |
А на ipsc того же афтара (Интел) ты не смотрел? Они там переизобрели язык С. |
Ага, в году семь 31-дневных |
Ага, в году семь 31-дневных месяцев, что покрывает февральское проседание. |
Ага. Поэтому надо требовать |
Ага. Поэтому надо требовать возмещения за 31-дневный месяц! |
хотя не, цены ведь за месяц |
хотя не, цены ведь за месяц |
Афёра |
https://www.moedelo.org/Pays/RefundPolicy.aspx Учитывая то, что минимальный тариф у них год, то получается 365*3840р/30=46720р |
ну тогда SSD - шаг к изобретению оперативной памяти, не теря |
ну тогда SSD - шаг к изобретению оперативной памяти, не теряющей информации при отключении питания. |
С записью - вопросов нет, сериализация может быть полезной, |
С записью - вопросов нет, сериализация может быть полезной, а накопление и переупорядочение - без вопросов полезно. Хотя мои эксперименты с gjournal дали какие-то печальные результаты, но это было давно, я с тех пор сполз на ZFS и счастлив с ней. А вот с чтением, ну да, префетч наверное рулит - если вы собираетесь из этого места читать дальше. Но в случае random IO - нет, не собираюсь. |
geom_cache читает с носителя блоками не менее чем ему задано |
geom_cache читает с носителя блоками не менее чем ему задано, я ставлю MAXPHYS (128K), плюс кеширует. Для рейдов, которые разбивают запрос на N частей и читают каждую часть с отдельных дисков в параллель, можно поверх поставить gcache с N-кратным размером страйпа, чтобы к дискам уходили не мелкие запросы на чтение, а крупные. geom_journal пишет данные в журнал линейно, раскидывая их потом по диску уже позже и асинхронно. Для кучи мелких записей производительность сильно увеличивается, для длинной линейной записи вдвое уменьшается (сначала запись в журнал, потом из журнала на fs). |
Ну за тем исключением, что при пропадании питания будет сюрп |
Ну за тем исключением, что при пропадании питания будет сюрприз. Только вот DDR3 стоит ~$50 за 4Gb, а флэша на эти деньги можно купить примерно 20Gb. |
Pages
