Postgresql 8.3b1 UTF conversion patch

Я уже писал (а потом писал еще), что, в силу многих причин, стандартное поведение PostgreSQL при конверсии из UTF-8 в однобайтовые русские кодировки меня не устраивает. Ну нельзя обижаться и ломаться в ситуации, когда мы, например, импортировали текст в кодировке windows-1251 с кавычками-лапками, а показать хотим его в KOI8-R, где кавычек-лапок нет.

Патч для версий 8.1.4-8.2 можно найти по ссылке выше. Для 8.3-beta1 он не подходит, поэтому пришлось сделать новый: postgres-8.3.b1-conversion.patch.gz

Это хак, правильность которого я обсуждать не желаю, ибо идеологически он неверен, но без него не работают старые приложения.

NVidia G92: совсем не то, что хотелось

Как многие уже знают, сегодня Nvidia анонсировала видеокарту GeForce 8800GT на новом чипсете G92.

То что анонсировано, сильно отличается от того, что прогнозировали весной, никакого терафлопа нету, новый чипсет медленнее и предыдущей топовой модели 8800Ultra и следующей за ней 8800GTX.

Муар или детали ?

Не все об этом задумывались, но в подавляющем большинстве цифровых фотоаппаратов на матрице стоит так называемый 'anti-alias'-фильтр, предназначенный для подавления муара. По сути, он просто слегка размывает резкость (примерно на полтора пикселя), подавляя мелкие детали изображения. Без фильтра очень легко получить муар на мелких регулярных структурах вроде трикотажа или забора из сетки.

Возникновение муара связано с тем, что каждый отдельный пиксель не несет полной информации о цвете (на обычной матрице каждый отдельный пиксель чувствителен только к одному цветовому компонент,...

Леопольдовое

В Леопольде появилась родная раскладка Russian-PC, где на привычном (виндовому пользователю) расположены точка, запятая и прочие знаки вопроса.

Впрочем, с возникшей сразу идеей прикрутить RuSwitcher и переключаться одной кнопкой пришлось обломаться. RuSwitcher под Леопольдом не заработал.

Leopard, Firefox и русские шрифты

После апгрейда до леопарды, русские тайтлы в табах Firefox выглядят так (слегка видно, что в заголовке окна все нормально):

leopard1.png

А русские надписи на кнопках вот так:

leopard2.png

В воздухе отчетливо запахло 1999-м годом.

Статистика для блоггеров - 2

Как показывает статистика, наибольший интерес за прошедшую неделю вызвала запись про статистику:
blogstat2-1.png
Поэтому позволю себе привести еще примеров данных, получаемых после обвешивания всего прозрачными пикселями 1x1. Естественно, что все данные, которые мы можем получить для блога в-целом, мы можем получить и для отдельной записи. Естественно, чтобы получать данные по тем страницам, где записей много (френдленты, списки категорий) каждый анонс должен быть снабжен уникальным пикселем...

Восемьсот килосайтов

Через месяц после регистрации миллионного домена в .RU случилась и очередная круглая цифра в черном квадрате: взяли рубеж в 800 живых килосайтов.

Семьсот тысяч было в начале июля, темпы роста практически сохраняются: в марте-июне было 60% годовых, в июле-октябре 56%, но это ведь был мертвый летний сезон.

По моим прикидкам, в течение месяца должны достичь миллиона делегированных.

Положи на....

Господа гусары,

а это только у меня эта реклама вызывает смешанные чувства:

_MG_2291.jpg
или все такие же испорченные ?

Коммерсант-бизнес-гайд за вчера, "Логистика".

Коммерсант о SEO

В сегодняшнем бумажном Коммерсанте статья про SEO. Точнее, конечно, про linkbombing в Яндексе, упоминаются так любимые сообществом гавно и отстой (ссылок не даю, Яндекс сегодня все поправил).

Больше всего жгут цитаты (вырываю из контекста):

"Яндекс" решить эту проблему не в состоянии.
В "Яндексе" об этом знают, но эффективных средств борьбы пока не видят.
И остается только ждать, пока Ларри Пейдж придумает более эффективный "движок"

Кто следил за темой, Яндекс поправил выдачу вчера (или раньше) или уже после выхода публикации ? Или нашли эффективные средства борьбы ?

UPD: прямая ссылка, спасибо motto в ЖЖ и Юрию Аксенову в Я.ру

Черный квадрат: DNS-статистика

В обсуждении моей предыдущей заметки о пятничных сайтах родилась здравая мысль: посмотреть на статистику смены сайтами IP-адресов. Мне всегда казалось, что смена адреса — крайне редкое явление, но интересно проверить так ли это.

Не углубляясь далеко в историю, я взял данные за последние 4 понедельника, с 24 сентября по 15 октября включительно. На каждый из понедельников у меня есть:

  • данные по делегированию: имеется ли для данного домена nameserver (по мнению NS-ов для зон .RU/.SU);
  • данные по резолвингу WWW-сайтов: удалось ли получить из DNS запись для www.domain. или domain.

Из этого удается извлечь достаточно любопытные данные.

Пятничные сайты

Я на эту тему уже писал, но готов утверждение усилить.

Каждый понедельник в 9 утра у меня стартует очередная выкачка для черного квадрата. К утру вторника оно резолвит и выкачивает все, что резолвится и выкачивается с первого раза. Последние месяца два - это процентов 80-85% от того, что показано на квадрате, где-то 650-680 тысяч сайтов отвечают с первого раза (цифры для последних трех недель).

После этого наблюдается весьма странная картина:

  • Во вторник-четверг пополнить квадрат толком не удается. Сайтов, которые не работали в понедельник, но починились к утру четверга - относительно немного. Ну скажем еще 40 тысяч за три дня удается окучить. Каждый новый проход находит 3-5% живых среди ранее неживых.
  • вечером четверга живых (среди ранее мертвых) куда больше, начиная с этого момента и до субботы каждый новый проход оживляет процентов 9-10.

Что это ? Десятки тысяч сайтов падают на выходных, их всю неделю чинят, к четвергу достигают успеха ?

Какой-либо статистики (по хостингу, по IP, по whois, по списку сайтов) я не делал, но руки уже чешутся.

Статистика для блоггеров

Сначала картинка. А вы так можете (не по цифрам, а по группировке данных)? Более подробные картинки будут ниже.
blogstats1.png
Я не знаю, есть ли нормальные средства статистики для блоггеров. Наверное, для простых случаев — есть. В ЖЖ можно поставить один из множества ЖЖ-счетчиков (уж не знаю, хороши ли они), на standalone-блог можно поставить обычный счетчик. Но это — для простого случая.

У меня случай сложнее....

Bluetooth sucks too

Если все 4 имеющихся процессорных ядра загрузить чем-нибудь хорошим (у меня это обычно Photoshop в батче + под VMWare что-нибудь толстое + еще какая-нибудь гадость), то bluetooth-мышка начинает тормозить. Просто не успевает за движением руки. Раздражает ужасно.

Переключение MS-овского донгла обратно из настоящего bluetooth в имевшийся при покупке 'hardware bluetooth support' (хоть убей, не знаю что это значит) помогает, но не кардинально.

Приходится, как лоху, держать поблизости проводную MX-518 и в периоды больших загрузок переключаться на нее. А у нее колесо не такое приятное.

Кругом враги.

Умножение матриц, серия 5: вычисления на GPU (2)

Почему переделываем тесты?

Предыдущая моя статья на эту тему была написана в феврале 2007 года, сразу после выхода первой публичной бета-версии CUDA Toolkit/CUDA SDK. Представители NVidia предупреждали, что в бета-версии производительность не является оптимальной, к релизу она будет улучшена.

За прошедшие полгода, пока я занимался совсем другими вещами, были выпущены релизы:

  • NVidia CUDA: SDK и библиотеки CUBLAS/CUFFT v1.0;
  • NVidia CUDA Display Driver 162.xx (драйвер, собственно, транслирует псевдокод в реальные программы GPU);
  • RapidMind Platform версий 2.0.0, а затем и 2.0.1.

Интересно посмотреть, стала ли производительность лучше.

Буря... мглою...

(открыть побольше)
XN8B4099.jpg
Одно из важных достоинств Кольского полуострова: куда бы оттуда не возвращаться, любая погода в месте возвращения еще долго будет считаться хорошей.

Хибинское

Прямо на базе МЧС, от ворот базы. На заднем плане Рисчорр.
(кликабельно)
XN8B4072-4077.jpg

Склейка из нескольких кадров, естественно.

67°45.4' N — 34°44.4' E

Ручей Чивруай (и не выговорить), посередине тамошнего каскада водопадов.
(как всегда, кликабельно)
XN8B3901.jpg

Про ошибки на жестких дисках

Вот берем Data Sheet на терабайтный диск от Seagate. Читаем там:
  • Capacity: 1Tb. Или, другими словами, 8*1012 бит.
  • Nonrecoverable Read Errors per bits Read: 1 per 10E14.
Кто бы мне пояснил, что все это значит:
  • На каждые 12.5 чтений я вправе ожидать ошибку (в-среднем, естественно) ?
  • Или из каждых 12.5 дисков - у одного (в-среднем) будет ошибка, а остальные 11.5 - нормальные?
  • Или цифирки BER приводят до error recovery, а реально там еще несколько (много) порядков добавляется на ECC ?
  • Или вообще, это такая абстракция ?
Про AFR/MTBF у меня тоже нет полного понимания, но давайте сначала с BER разберемся.

Кольское

Горные озера тоже оборудуют радугой:

XN8B3830.jpg
(кликабельно)

Озеро Райявр, что в юго-восточной части Ловозерских тундр.

Microsoft Bluetooth, часть 2

После вчерашних приключений я решил поапдейтить этой мыши софт, MS IntelliPoint. С ней шла версия 6.1, на сайте MS лежит 6.2.

В процессе установки случилось интересное: не спрося меня ни о чем, варез сказал "а сейчас мы из вашего трансивера будем делать настоящий Bluetooth, ничего не трогайте". После чего минуту мигал лампочками на трансивере и мыши, в Windows образовалась закладка с настройками Bluetooth, куда удалось без проблем подключить другие BT-устройства. Да и мышь там образовалась в списке.

Однако попытка совокупить мышь с другими BT-передатчиками, что от Mac, что от Bluetake, кончилась ничем. Инструкция гласит:

Нажмите у мыши на пузе кнопку, держите пока не замигает лампочка.
Нажимал. Не мигает.

У меня две гипотезы:

  • Либо неисправна кнопка, отчего все мои вчерашние мучения и проистекли. Пишут ведь, что все работает.
  • Либо маркетологи MS еще подумают и в IntelliPoint 6.3 не только трансивер станет настоящим, но и кнопку на мыши разрешат.

Мучительные варианты. Если кнопка неисправна, то надо купить еще одну такую же мышь к ноуту (обсуждаемая уже живет на десктопе и ей там хорошо). Если это софтверное, то подключиться к MBPro без трансивера пока не выйдет.

Да, под Mac OS таких глупостей, как переключить режим трансивера из USB-хаба (это называется hardware bluetooth support) в BT-трансивер — не предлагают. Все работает "как USB-hub"

Bluetooth от Microsoft ?

Дано:
  1. Microsoft Wireless Laser Mouse 8000. Вся в логотипах Bluetooth (по меньшей мере две штуки, сверху и на пузе).
  2. Прилагаемый к ней Transceiver v3.0 for Bluetooth, model 1063. Обычный такой USB-dongle. Тоже с BT-логотипом.

Имеем:

Целый ряд странных чудес, в частности:

  • Донгл распознается как USB-хаб, а вовсе не как BT-radio. Соответственно, в Windows не образуется Bluetooth-апплета в Control Panel.
  • Так как донгл не прикидывается BT-устройством, то снюхатся с телефонами, клавиатурами и прочими BT-устройствами через него не получается. Про рассматриваемую мышь - ниже.
  • Если донгл воткнуть в порт, то в системе образуется работающая мышь. Без всяких глупостей, вроде поиска BT-устройств, ввода ключей и подобного идиотизма. Эффект наблюдается и под Windows XP и под Mac OS X.
  • Если донгл вынуть, то ни на Макбуке (BT встроен), ни на Windows (BT-dongle с надписью Bluetake) обнаружить мышь не получается. Другие BT-устройства - пожалуйста.

Другими словами, есть отличная wireless mouse. Я, пожалуй, даже проводную свою старую Logitech MX518 положу отдыхать в шкафу, новая — лучше. Но не понимаю я вот чего:

  • Какого рожна на этом изделии от MS везде написано Bluetooth и нарисован логотип?
  • Зачем я ставил на уши весь ТЦ "Черемушки" в поисках Bluetooth-мыши, если в результате купил обычную Wireless ?

Я подозреваю, что это то самое, что у MS называется «First connect technology», но почему нигде не пишут, что это еще и Last connect ?

Опять про MovableType и dirify

Сегодня меня порадовали, дескать подписка на комментарии в твоем блоге не работает.

Действительно, на ряде записей ссылка "подписаться на комментарии к этой записи по RSS" была битая, вела на несуществующий фид.

Разбирательство показало, что:

  • Это касается только записей, где последняя буква (буквы) в title - непечатная (мягкий-твердый знак или знаки препинания). Эти символы дирифицируются в подчеркивание.
  • Сами такие записи имели URL вида date/bla_bla_.html (фиды: bla_bla_.xml).
  • Ссылки из списков записей (по месяцам, по рубрикам) были правильными.
  • А вот
  • ...

Вопрос про мониторинг ЖЖ

А вот есть ли какой-то способ быстро (секунды) узнавать, что в ЖЖ-юзер написал новый пост? Мониторить надо, допустим, несколько тысяч журналов.

Вижу такое решение: зафрендить и мониторить френдленту, но ведь забанят, если раз в 10-15 секунд ее дергать ?

P.S. Задавать вопросы в блоге понравилось. Работает, ответы хорошие. Попробую еще.

Мечта об RSS-читалке для гиков

Вот читаю я RSS-потоки, штук эдак 100, а хотел бы и больше. Разные, про фото, про железо, про софт, просто потоки сознания. И вот что меня достало:
  • Неинтересные мне темы. Хочу читать новости про Apple, но ни слова про iPhone. Идеально было бы отложить весь iPhone отовсюду в отдельную папочку и ее уже не читать.
  • Дубли. Выпустил Nikon новую камеру, так об этом напишут все. И фотографы и фото-новости и новости железа и вообще все. Половина просто перепечатает пресс-релиз, а вторая половина - перепечатает и откомментирует.
  • Редкие жемчуга в куче понятно чего. Ленты в которых 99% неинтересны (тематика не та), но зато остальной процент - интересен крайне.

Вот и интересно, может быть есть готовое счастье, которое бы делало простые вещи:

  1. негативную фильтрацию по ключевым словам (все кроме iPhone);
  2. позитивную фильтрацию (все про Photoshop, а остальные новости Adobe неинтересны);
  3. несколькоуровневую кластеризацию (темы-похожие тексты - полные дубли);
  4. архивацию хотя бы за несколько месяцев, а лучше вечную;
  5. поиск по архиву.
Хочу десктопное приложение (Win или Win+Mac) или в крайнем случае сервис. Готов дать денег.

Pages

Subscribe to blog.lexa.ru: все статьи