Свежие комментарии

Title Comment
Устойчивое ощущение, что было здесь. http://www.livejournal

Устойчивое ощущение, что было здесь.

http://www.livejournal.com/manage/subscriptions/

Но не могу найти почему-то. То ли убрали, то ли у меня галлюцинации.

А как это? Где-то в настройках?

А как это? Где-то в настройках?

зато асинхронный режим появился

зато асинхронный режим появился

обещали сильно уменьшить задержки, но что-то незаметно как б

обещали сильно уменьшить задержки, но что-то незаметно
как было порядка 10 микросекунд, так и осталось
может я чего-то не понимаю

<b>возвращаясь к теме :)</b><br/> я вот тут заметил одну шту

возвращаясь к теме :)
я вот тут заметил одну штуку, и вспомнил ваш пост. если вдруг ещЁ интересует, то встроеная рсс-читалка в Opera умеет всЁ кроме пункта 3, русский язык понимает, вроде даж поддерживает нормальные регекспы :)

Он в девелоперской части https://developer.rapidmind.net/sam

Он в девелоперской части
https://developer.rapidmind.net/sample-code/matrix-multiplication-samples/

Там *была* простая регистрация для всех, что сейчас - не знаю

Уже появился первый реальный подборщик паролей от Elcomsoft.

Уже появился первый реальный подборщик паролей от Elcomsoft.

Но вообще - скоро. Ведь до конца ноября CUDA требовала (от юзера) установки специального видеодрайвера, а скоро эта функциональность будет в стандартном драйвере NVidia (пока только в бета-версии)

Скажите мне, простому юзеру када первые реальные приложения

Скажите мне, простому юзеру када первые реальные приложения появятся на компе с использованием CUDA?

Здравствуйте. Не могу найти код SGEMM для RapidMind. Он в де

Здравствуйте. Не могу найти код SGEMM для RapidMind.
Он в девелоперской части сайта? К ней сложно получить доступ?

а когда SMS приходит об изменении тарификации и просят прочи

а когда SMS приходит об изменении тарификации и просят прочитать подробности на сайте.
разумеется на сайте нет ни слова об этом.
конкретно яйцеголовые в этом замечены были совсем недавно.
я думаю, что это не маленькая компания

Да домен индустрия идет вперед семимильными шагами

Да домен индустрия идет вперед семимильными шагами

да ладно, тут у нас президент на всю страну неправильный тел

да ладно, тут у нас президент на всю страну неправильный телефонный номер продиктовал.

http://thinkprogress.org/2007/12/06/bush-gives-out-wrong-number-on-natio...

Похоже, те-же люди, что мероприятия сиски обхаживают :)

Похоже, те-же люди, что мероприятия сиски обхаживают :)

Звал, но так как я не ходил, то и не вчитывался. А ход - но

Звал, но так как я не ходил, то и не вчитывался.

А ход - нормальный, приглашают только мальчиков с феноменальной памятью

о! тебя гугль никогда никуда не звал? Короче, есть у гугла

о!
тебя гугль никогда никуда не звал?

Короче, есть у гугла пиар-агенство, оно обсуживает их мероприятия и вообще пиар.
Фирменный стиль -- слать приглашения, к которому приаттачено то же приглашение, но уже в виде картинки, а текст "пожалуста, подтвердите свое участие до (дата)" присутствует только на картинке

ну и еще много сладкого

поясни, а то я похоже темный.

поясни, а то я похоже темный.

есть еще пугающий вариант оп имени &quot;Маслов и Партнеры&q

есть еще пугающий вариант оп имени "Маслов и Партнеры"

Я считал такой бардак типичным для средней компании. Когда у

Я считал такой бардак типичным для средней компании. Когда уже пишут в блог и заводят алиасы разные люди, но еще не появилось автоматической процедуры, фиксящей подобные баги.

Большая компания. В блоге один пишет, почтовые алиасы другой

Большая компания. В блоге один пишет, почтовые алиасы другой заводит. Второй чай пить ушел не успев задание выполнить, а ты уже письмо отправил.

Алексей, большое спасибо за подсказки и за статью, благодар

Алексей,
большое спасибо за подсказки и за статью, благодаря им удалось увеличить скорость обработки на порядки. Изменение порядка чтения и записи помогло :-)

Насчет задач с низкой арифметикой вы правы, перенос остальных расчетов на карту - следующий этап, пока хочется разобраться с более простой задачей, хотя уже сейчас у меня не просто сравниваются два значения а, они сравниваются побитно по хитрому алгоритму - эта процедура на CPU занимает очень много времени из-за чего собственно и встал вопрос использования GPU

(я Алексей :) Да, неравноконтрастна. Но пока отклонения мал

(я Алексей :)

Да, неравноконтрастна. Но пока отклонения маленькие - это неважно.

Чтобы делать Lab-RGB-Lab без клиппинга нужно очень широкое RGB-пространство, а это удаляет эксперимент от жизни.

Александр, у меня вообще по прочтению вопрос появился по мет

Александр, у меня вообще по прочтению вопрос появился по методике оценки.
почему вы расчитываете отклонение в пространстве ргб. ведь эта система неравноконтрастна,
почему вы не считали отклонение при конвертировании лаб-- ргб--лаб ?

Сергей, да, естественно, с записью в global memory будут те

Сергей,

да, естественно, с записью в global memory будут те же проблемы, что и с чтением. Нужно писать 'coalesced' способом, т.е. одновременно из разных тредов в соседние элементы. Тогда вы скорости в десятки гигабайт в секунду скорее всего достигнете. Но это в случае, если вы из каждого thread пишете 4-байтовые слова.
Если же у вас на выходе битовая матрица, то придется организовывать работу так, чтобы запись в global memory была именно 4-байтовыми словами.

Но главное узкое место будет даже не запись в global memory, а вывод обратно на хост. Если в global memory можно (предположительно) писать десятками гигабайт в секунду, то download из карты - около гигабайта в сек. Прикидываем на пальцах - полтора миллиона * 100 тысяч * 4 байта - 600 гигабайт. Во-первых, эти 600 гигабайт надо куда-то деть на хосте, а во-вторых они будут передаваться минут 10 сами по себе.

Вообще, для задач с низкой арифметической сложностью (отношение вычислений к чтениям или записям памяти) перенос их на видеокарту не имеет большого смысла, весь выигрыш от быстрой памяти съест передача данных туда и обратно.

Алексей, здравствуйте, я совсем недавно столкнулся с CUDA и

Алексей, здравствуйте, я совсем недавно столкнулся с CUDA и еще не до конца разобрался во всех премудростях работы с данной технологий.
В Вашей статье главным образом рассматривается скорость чтения как основная проблема в производительности, а как быть со скоростью записи? Относятся ли к записи в память все те же правила оптимизации, что и к чтению (проверить на практике еще не успел)? Или есть какие либо другие способы увеличить скорость записи в память?
Я решаю следующую задачку: есть два линейных массива X (1.5 млн. элементов) и Y(100 тыс.)- нужно сравнить каждый элемент X с каждым Y и результат сравнения записать в массив Z размерностью SizeX*SizeY. В результате экспериментов выяснилось что основная проблема быстродействия это сохранение результатов - 20 мин против 1 минуты без записи результата на массивах указанной размерности. Может быть подскажите куда копать?

Тезисы - это прикольно, а как бы код пощупать

Тезисы - это прикольно, а как бы код пощупать

У меня жесткий где тодько не валялся, несколько раз падал и

У меня жесткий где тодько не валялся, несколько раз падал и ниче живет пока

о перемножении м-ц см. страницу, посвященную Core 2 Duo (IA3

о перемножении м-ц см. страницу, посвященную Core 2 Duo (IA32) (таблица 3):
http://www.thesa-store.com/products/

нас целая армия, а над нами кукловод:)

нас целая армия, а над нами кукловод:)

Сам столкнулся с этим. Это нарушение как закона о защите пра

Сам столкнулся с этим. Это нарушение как закона о защите прав потребителя, так и кодекса об административных правонарушениях и воздушного кодекса ОФ. Сейчас подаю на них суд. Думаю придется это довест идо Европы, т.к. в РФ суды падкие на наличные...

Мда, на опечатках трафика можно нагнать много, народу неграм

Мда, на опечатках трафика можно нагнать много, народу неграмотного хватает)

Pages

Subscribe to comments_recent_new