Skip to Content

Январь 2012

Про HD7970

Договорился с жабой и купил новую грелку для ног.

Вкратце:

  • OpenCL 1.1, поддерживается, работает. Посмотреть что там за код не получается, Kernel Analyzer не умеет это место.
  • Драйвера: под винды есть, бета, в основной Catalyst не включены (и, похоже, войдут не раньше чем в 12.3 т.е. через два месяца т.к. даже в 12.2-preview поддержки 79xx нет). Драйвера под линукс поискал для проформы (мне не надо) - и не нашел.
  • Сцуко, быстрая. Один и тот же OpenCL-код (написанный с оглядкой на NVidia Fermi) работает в-среднем раза в полтора быстрее, чем на GTX480 (single precision). Предыдущая моя ATI-шная карта, HD5870 была в 1.5-2 раза медленнее 480-й нвидии.

    На примере MatrixMultiplication из AMD APP - быстрее в 4 раза (single).

    С double не все так радужно - нужно явно как-то иначе оптимизировать, а может просто драйвера кривые. На всем что попробовал, 7970 получается непринципиально быстрее GTX480, а на каких-то задачах и помедленнее.

  • Сцуко, холодная. Idle temp 44C, прогреть больше чем до 80 счетным кодом не удалось. Наверное, если получше пооптимизироваться, то удастся подогреть больше. Ноги, короче, не греет.
  • Сцуко, тихая. Ну то есть если вручную вентиляторы поставить на 100%, то громкая, как и любая современная видеокарта со штатным охлаждением, но вышеуказанные 80 градусов были при скорости вентилятора чуть больше 2500RPM, это меньше половины (100% - 5400) и на этой скорости она тихая.
Заодно выяснил, что за тот год, что я туда не заглядывал - AMD'шный гайд по OpenCL стал из вообще никакого - довольно интересным чтением. Сижу, читаю. Про Tahiti там пока мало и невнятно, но какой-то раздел по оптимизации уже есть.

P.S. В игры - не играю, ничего не проверял. С картой был купон на DiRT3, но годный до 31 декабря. Смешно, в продаже они появились за неделю до этого....

P.P.S. Lux Render отчего-то вторую карту не видит, как и 5870 не видел. Все прочие разумные тулзы, вроде clinfo и CPU-Z - видят. Прямо хоть в сорцы лезь....

О техническом писательстве

Пишу доку к варезу, первый раз за много лет - для обычного пользователя, сферического в вакууме (все что писал в последние годы - было доками по библиотекам т.е. для программистов).

Нашел в самой задаче крупное логическое противоречие:

  1. С одной стороны: загружать разработчика такой работой - противоречит самой идее разделения труда. Архитекторы должны архитектить, кодеры - кодить, тестеры - тестить, технические писатели - писать мануалы, а специалисты по пуговицам - пришивать пуговицы.
  2. С другой стороны: технический писатель имеет дело с черным ящиком. Он не знает что там внутри, если в программе вдруг что-то нелогично, то не его (писательское) дело против этого протестовать. Ему что дали - про то он и споет.

    У разработчика же глаз замылен - ему в процессе работы весь этот варез уже опротивел, он если добавил новую фичу (сам или архитектор ему наархитектил), то протестирует только ее (в лучшем случае, а в худшем - не тестируя отдаст тестеру), а как она вписывается в общую конструкцию - смотреть не будет т.к. в другие места программы в процессе разработки не полезет.

    А вот пиша (писуя?) документацию - до всех потаенных углов долезешь и все нелогичности внезапно увидишь. У меня список мелких багов образовался за время писания - больший, чем за предыдущие месяц-два.

У меня нет никакого конструктива, понятно что варез большого размера в одно рыло не разработать, а значит разделение труда - необходимо(е зло). Но все вместе наводит на меня тоску: найм техписателя для написания доки автоматически означает ухудшение качества продукта (в хорошем случае - с одновременным улучшением качества документации).

Грелки для ног и гигафлопсы

У желающих пощупать за вымя свежую архитектуру HD79xx есть два разумных выбора:

  • Купить 7970 сейчас (принципиально дешеветь дальше уже не будет, пока не отрастут конкуренты).
  • Подождать месяцок до реального появления в продаже 7950, которая будет примерно на сотку баксов дешевле.

Чтобы оправдать первый вариант (руки то чешутся), вот такой вот расчет:

HD7970

  • 2048 cores x 925 MHz /2 = 947 GFLOP/s (теоретическая, на double).
  • Рекомендованная цена $550 (и в newegg теоретически за столько можно купить) т.е. 1.72 GFLOPS/$
  • Реальная цена в московской рознице 19000, т.е. 0.0499 GFLOPS/руб.
HD7950
  • 1792 cores * 800 MHz /2 = 716 GFLOP/s.
  • Рекомендованая цена $450 т.е. 1.59 GFLOPS/$
  • Какая будет цена в московской рознице - непонятно, но чтобы сравняться с 7970 по гигафлопсам на рупь, цена должна быть 14400, что крайне маловероятно. А 7970 может еще на тысчонку подешеветь спокойно.

Теоретически, конечно, 7950 хорошо гонится, может быть даже лучше чем 7970. Но практика для предыдуших двух серий Радеонов показывает, что многочасовой расчет на штатной частоте (без снижения) - это уже прекрасный результат и всерьез надеяться на оверклок не стоит. Игры в этом месте менее показательны, они пушат лимитсы меньше, чем любовно оптимизированный расчет.

Короче, моя жаба приведенным выше расчетом - удовлетворилась.

Мастера художественного передергивания

Очень трудно удержаться и вообще ничего не писать о политике. Вот опять не получилось.

Вот есть свежий опрос Левады. Всех, понятно, интересуют предстоящие выборы, там эта тема раскрыта двумя способами:

  • Открытый список, хоть Дарта Вейдера вписывай. По этому методу у Путина 37% поддержки (проголосовал бы за него в ближайшие выходные) от населения, у Зюганова ( 2) - 8%. А 41% населения тем или иным способом затруднился с ответом.
  • Закрытый список, проценты только от определившихся: 63% запутина, 15% зазюганова.
Дальше пресса начинает об этом писать. Ну, понятно, что 8 против 37, что 15 против 63 - разные весовые категории, и там и сям 4.5 раза. Поэтому мастера журналистики для Пу берут цифирку из первой таблички (поменьше), а для Зю - из второй (побольше).

Отличились:

Молодцы, че. В борьбе за правое дело и передернуть не грех. А если вдруг Пу наберет over 50 (или 60) в первом же туре (что, согласно результатам вышеупомянутого опроса, вполне вероятно) - массовка будет заранее знать что все подтасовано, ибо соцопросы давали 37%

Пацан сказал - пацан сделал

Собянин пообещал, что лыжни будут проложены в каждом московском парке и зоне отдыха.

И я сегодня такую в нашей роще нашел. Оказывается, их делают по краю пешеходных дорожек, ну и по открытой местности, а я шарился по кустам все время. Ну я, естественно, не настоящий лыжник и в раньшие годы машинную лыжню только в Красногорске встречал, куда ехать был геморой.

Имею сказать, что это совершенно новый класс ощущений, проехал раза в три больше, чем обычно.

10G дома: 6 букв, вторая "и"

Приехали первые (короткие) CX4-кабели и я начал поднимать Infiniband прямо на столе (до сервера эти кабели не дотянутся).

Собственно, исходно я клюнул на IB из соображений поразвлечься. Имею сказать, что развлекся я уже по полной программе, эти $69 себя уже окупили полностью.

Две машины, Win 7 x64 и Ubuntu 11.10.

Ставим драйвера (OFED 3.0 под Windows, драйвера из поставки в Убунте, кажется это Linux OFED 1.4.x), всовываем кабель, запускаем opensm, имеем в первом приближении счастье: PORT_ACTIVE

Во втором приближении - тоже счастье, ibping работает.

В третьем приближении - несчастье. IPoIB - не работает. И Win-Win и Win-Linux ситуация одинаковая, под Win-Win пробовал кроме OFED 3.0, еще и 2.3 и родной Mellanox-овский стек 2.1.2. Во всех случаях ping не пингает, причем из порта (по данным tcpdump) ничего не вылезает.

Присматриваюсь повнимательнее, вижу что вместо LinkWidth 4X имею 1X.

Подземный стук - 2

Продолжение истории начатой здесь

Я не верю, что битая памяь может выражаться в тормозах. В падениях программ, в битых файлах - это пожалуйста. Но тормоза? Впрочем, я не гордый, раз все советуют, запустить memtest несложно.

Ставлю по одному модулю (чтобы потом не разбираться, какой адрес ошибки какому модулю соответствует), проверяю, ничего не находится. Как, собственно, и ожидалось.

Но ночью приходит такой вот комментарий:

Это звучит как проблема с кешированием памяти. Есть на MacOSX какие-то средства посмотреть конфигурацию MTRR, как memcontrol(8) во FreeBSD ? Когда-то давно очень часто BIOSы забывали правильно сконфигурировать MTRR для страниц выше 4GB.

И вот эта идея, в отличие от битой памяти, не противоречит моим мироощущениям.

Ставлю все 8Gb, запускаю memtest и вот что оказывается:

Подземный стук

Есть у меня MacBook Pro, почти новый, пяти лет еще нету.

И решил я ему сделать подарок на новый год: поапгрейдил память до 8Gb, пока DDR2 совсем из продажи не пропала. Сделал. Где-то в начале декабря.

Пользуюсь я им мало, почти совсем не, поэтому только к середине января заметил, что прошедших до конца бэкапов у меня с 1 декабря и не было. Стал разбираться. Увидел странное:

  • Сразу после включения машинка работает весьма бодро. Первые минут 10 (если ничего не делать, то и дольше).
  • После нескольких гигабайт I/O начинается чертовщина:
    • Полностью или почти полностью исчезает idle time
    • Минимальные программы, вроде top, могут жрать 20-40% CPU
    • Все действия необычайно замедляются, запуск Firefox может минут 20 занимать.
    • Бэкап на time machine - первые 2-6Gb пролетают мухой, что по 1G Ether, что по Wifi, а потом все встает колом и все мои 80Gb бэкапятся больше суток.
Первая гипотеза: перегревается процессор и делает сам себе throttle. Поставил варез, померял, ну греется где-то до 80-85, много, но не запредельно (TjMax у процессора - 100).

Развинтил, действительно термопаста высохла (что не означает, что она не отводила), намазал новой, стало получше, но не сильно. Поставил программу, которая раскручивает вентиляторы, максимальная скорость, температура процессора 40-65, но все равно тормозит.

Q: нано-GIS для андроида

А вот вчера меня спросили, а я и не знаю что ответить.

Представим, есть Андроид-планшет с GPS-приемником.

Хочется счастья следующего вида:

  • Несколько слоев растровых карт (собственно топографические карты разных масштабов, снимок такой, снимок сякой, геологическая карта)
  • Включать/выключать слои.
  • Ставить и аннотировать точки.
  • Импорт-экспорт в какой-то несложный GIS на PC (вроде SAS-Planet). Т.е. подготовка вышеописанных слоев делается, естественно, заранее.
Меня эта тема никогда не интересовала т.к. автономность у андроид-планшетов никак не устраивает. Но у спрашивающего есть автомобиль более-менее под рукой (в базовом лагере) т.е. можно каждый день подзаряжаться от пуза.

Есть что-то готовое? Бесплатность необязательна, нужно для работы, можно и заплатить, а вот возможность попробовать до покупки - желательна.

А: корпус для HDD

Алаверды ко вчерашнему посту про корпуса для HDD.

Как мне подсказали, есть конструкторы "JBOD-массивов", собирай сам. Смотрел я на них, мне не понравилось что у 9-bay варианта глубина аж 44 сантиметра, это как у ATX-корпуса. Можно купить Antec Three Hundred: те же 9 bay, на два сантиметра глубже, но влезет ATX-материнка и с выдувом все нормально, а не мелкие шумные вентиляторы на жопе.

Зато внезапно стало понятно где искать, это нужен корпус к DVD-дупликатору, а не к JBOD-массиву. Лучшее что нашлось (в наличии, в Москве, в одном месте) выглядит так

Цена решения ~15500. С поправкой на то, что захочется поменять питальник и вентиляторы - ну наверное будет под 20к, 1300 за диск. Для хот-свапа очень даже приемлемо.

Без хот-свапа будет дешевле, но меньше дисков. Есть корзины 4HDD в 3 5.25, баксов по 20-25, уже с вентилятором, соответственно дисков в вышеупомянутом корпусе поместится 12. Цена решения (без учеты замены питальника) будет рублей 600 за дисковое место.

Ничего более компактного пока не нашел, хотя явно можно уменьшить по глубине еще сантиметров на 8.

Q: корпус для HDD

Граждане читатели!

А где берут корпуса вроде 10-дискового QNap, только без компьютера, RAID-контроллера и прочих глупостей. Нужен корпус, питальник, тихий вентилятор(ы) и все.

Идеал: 8-12 дисков, 2-3 Mini-SAS разъема, питальник. И все. Ну что-то в духе Synology DX1211, но без всех этих понтов с Infiniband и не за полтора килобакса. 12 дисков - лучше, на вырост пойдут...

Не, понятно, проще всего сколотить ящик из фанеры, поставить ATX-питальник и вентиляторы и не париться. Или какой-то компактный micro-ATX корпус подобрать, 8 дисков должны влезть.

Но где, блин, китайцы, которые уже все сделали? Ну то есть есть Sans Digital за 370+доставка (еще полторы сотни минимум, т.к. с доставкой не FedEx - не нашел), есть CFIB8283JDGG, который придется дотачивать напильником, выкидывая внутренний RAID-контроллер, но оба решения имеют размеры 12-дисковой станции Synology и только 8 дисков.

Мир нанотехнологий и дерзких инноваций!

Обнаружил в Swype распознавание голоса (на русском!)

Вечер потерян.

Работает, к несчастью, процентов на 95, то есть на практике применять не будешь. Но игрушка чумовая. Надо попробовать в твиттер гнать голосом.

Будни ИП

Проходил мимо налоговой, зашел, сдал "среднесписочную численность", увидел надпись крупными буквами, по смыслу такую:

НОВАЯ ФОРМА ДЕКЛАРАЦИИ УСН по приказу 48н от 20.04.2011 с измененим внесенными решением ВАС 3440/11 от такого-то числа (более позднего, чем приказ).

Суть: раньше (до 20.04.2011) у строки 280 (вычеты из 6%) было описание с перечислением вычетов на 4 строки, а теперь на 8 строк, добавилось много всяких расходов, не буду излагать, сами читайте приказ

Насладился чтением решения ВАС, просто получил истинное наслаждение. Решение от мая-2011, в числе прочего говорится что приказ Минфина (уже вышедший) мы за мясо не считаем т.к. Минюст его еще не зарегистрировал. Кстати, а если бы зарегистрировал, то с теми, кто в последние дни апреля прошлого года метался в налоговую - могла случиться отдельная веселуха.

Итого суд присудил взыскать с Минфина 200 рублей - возместить пошлину истцу. Интересно было бы понять, кто так наступил истцу на мозоль, что он до ВАС дошел...

Сухой остаток: форма декларации действительно изменилась, в том что вы сдаете писание 280-й строки должно быть длинным (~8 строчек), иначе имеют формальное право не принять, во всяком случае моя ИФНС 7728 об этом пишет строго.

При этом по смыслу для ИП-одиночки, который не страхуется от несчастных случаев на производстве и не платит (отсутствующим) сотрудникам по нетрудоспособности - ничего не меняется.

Если вы сдаете в электрическом виде, то тоже ничего не меняется, там описания строк в XML-ке нету.

P.S. У Эльбы форма новая, у МоегоДела сформировать декларацию по УСН на данную секунду нельзя, ждут смены КБК, проверить не могу.

Не корысти ради

Граждане читатели,

А ни у кого нету на время (1-2 недели) кабеля SFF-8470 - SFF-8470 c защелками (а не винтами) длиной метра 2-3? По таким гоняют 10G Ether, 4xSAS, ну и (как в моем случае) Infiniband.

А то карточки доехали, а кабеля еще где-то в районе китая.

Руки чешутся не настолько, чтобы покупать кабель здесь (всего-то раза в три дороже), но если у кого есть свободный и на ближайшие дни-недели ненужный, то я бы поигрался с им. Интересно же!

Update: заглянул в сервер и понял, что временного решения не получится, а заморачиваться с постоянным на заемных кабелях как-то неразумно. Поэтому вопрос снят.

Про Nikon D4 (и EOS 1dx)

Что, гонка мегапикселей все?

Как-то странно видеть micro-4/3 на 16Mpix (с вполне приемлемым качеством картинки при нормальном освещении) и вчетверо больший по площади сенсор на те же 16.

По мне, так 36-40 на FF были бы в самый раз.... Ну и биннинг до 10 при ISO800 и выше.



.