Разное

Систематизация архива е-книг (Q)

А вот, я извиняюсь, вопрос.

Есть большой архив электрической литературы, который возник по той простой причине, что нужные книжки почему-то оказываются в многогигабайтных архивах в торрентах, а не отдельными файлами (либо даже можно тянуть пофайлово, но названия файлов такие, что не разобраться без поллитры).

Форматы обычные для таких помоек: pdf (зачастую графический, а не текстовый), djvu, немножко офиса, немножко постскрипта. Все rar/zip-ы развернуты, время на это потратил уже. Десятки тысяч текстов, включая туда и все выпуски журнала "Мурзилка" (условно, Мурзилки как раз нет), первые сотни гигабайт на диске.

Хочется: распознать из каждой книжки первые 2-3 килобайта текста с каким-то качеством (можно - с плохим). Только автоматически, не открывая каждую в Файнридере. Распознавать целиком - слишком долго и не нужно, думаю что 99.9% этого надо просто стереть (или похранить, что то же самое).

Может быть есть какие-то средства automation оного FineReader (или каких-то других разумных OCR)? Куда копать?

(получив первые страницы текста, я уже знаю что с этим делать разумного: тематику постараюсь распознать, поисковый индекс по этому сделаю).

Загадка электронной коммерции

Вот скажем авиабилет Москва-Барнаул-Москва. На сайте UTair предлагают купить его за 10230 (утром самый дешевый вариант был 11230 на мои даты).

А в обычном оффлайновом агентстве мне его продали за 9890, включая 400 рублей комиссии агентства, которые они берут, по всей видимости, за распечатку электронного билета.

Самое смешное тут то, что в агентство я поперся т.к. хотел настоящего билета, ибо крайне не уверен, что сумею в Барнауле в 5 утра объяснить про электронный. Чувствую себя неуверенно.

P.S. В настоящую секунду awad.ru предлагает то же самое за те же 9890, а еще утром просил 16500. Я с них всех фигею.

Алтай, плато Укок, июнь, фототур (типа, реклама)

Я как-то расслабился насчет июня, ничего толком не вырисовывалось, а вдруг оно пришло само, как экипировка Атосу. Взяли и написали прошлогодние знакомые.

Далее - на правах рекламы в том смысле, что есть еще пара мест, если на них окажутся знакомые (пусть виртуально) люди, то наверное это хорошо.

Плато Укок, 14-23 июня 2009

Чуть более подробно, в телеграфном стиле

  • Фотографически это может быть довольно интересно.
  • Тур заявлен как фото-видео, съемочное время предусмотрено.
  • Организаторы обеспечивали нам логистику прошлым летом, обеспечили успешно.
  • Осталось два места. Чтобы я не работал испорченным телефоном или засорившимся клапаном, связывайтесь пожалуйста с организаторами самостоятельно (контакты на сайте). Хотите - ссылайтесь на меня, не хотите - не ссылайтесь.
  • Времени на принятие решения практически нет, это погранзона, формально документы на пропуск нужно подавать за месяц (и уже практически опоздали). И как следствие погранзоны - только рассияне.
  • Времени на принятие решения практически нет (уже было, кажется) - это энцефалитный район и если вы ломанетесь прививаться прямо завтра, то успеете тока-тока.
Dixi

Верните как было!

liru-14may.png

А это у нас 3/4 интернета куда-то подевалось или li.ru данные за сегодня проэтосамое?

P.S. Срез "все сайты"

Upd: да, за сегодня, с 00 по 11 часов. http://www.liveinternet.ru/stat/lexa-ru/hours.html

Счастье виртуализации достижимо

У меня дофига работы происходит под VMWare и все полностью устраивало, кроме одного моментика: если засаспендить большую виртуальную машину (скажем с 4-мя гигами RAM), то хост-система (Vista x64) на довольно долгое время (минут 5) впадает в депрессию: реактивность понижается до нуля, на кнопки не реагирует, на мышь тоже, думает о чем-то своем.

Рабочей гипотезой было то, что саспенд пишет в файл, этот файл кэшируется в файловом кэше, а потом медленно и печально выливается на диск. Кэш при этом, естественно, тоже вымыт нафиг и любая мелочь (DLL-ки там) требует доставания с диска, что в свою очередь интерферирует с вышеуказанным выливанием на диск.

Помогли следующие настройки виртуальной машины (которые я ставил вовсе для другого):

MemTrimRate = "0"
sched.mem.pshare.enable = "FALSE"
mainMem.useNamedFile = "FALSE"

Саспенд теперь происходит долго (не единицы секунд, а десятки), но и в процессе саспенда и сразу после него другие программы работают

Vista x64 driver signing hell

Я сделал это!

Потеряно два вечера и еще полдня, система два раза поднималась с бэкапа, но я таки подписал драйвера для Висты-x64 и они таки работают.

История вопроса

Есть такой Argyll CMS, который я уже многократно хвалил за качество CMM-модуля. И вообще, похоже что это необычайно ценный мех варез, ибо качество строимых им профилей необычайно хвалят.

Помимо этого, Argyll умеет работать с i1 Pro в точном режиме: со спектральным разрешением 3.33 нанометра вместо стандартных 10нм, что тешит мою склонность к перфекционизму.

Кроме того, тамошний дисплейный профайлер очень хвалят, хотелось попробовать самому.

Мешало пользовать эту полезную зверушку следующее обстоятельство:

  • Argyll использует libusb, которая конечно есть для Windows, но тамошние драйвера неподписаны, а значит на 64-битной висте можно этим пользоваться, только если при загрузке нажать F8 и выбрать режим, отключающий проверку подписи.
  • Если ставить кроме libusb еще и тамошний модуль фильтра (чтобы можно было использовать тот же i1 и из стандартных приложений), то без загруженного драйвера вся система не работает, а входит в вечный цикл перезагрузки.
  • Но нажимать всякий раз F8 на загрузке - мучительно и противно.

Еще про EMS (москвичам)

Мне в силу многих причин удобнее заехать в EMS на пр. Вернадского, чем ждать по полдня курьера, который либо приедет, либо приедет завтра. Но уже две посылки я так упустил: статус "отпущенно таможней и поступило в сортировочный центр" на веб-трекинге запаздывает, реально он появляется когда посылка уже может быть в службе доставки.

Позвонил EMS в хотлайн, имел беседу, из которой вынес следующее

  • Реальная раздача курьерам происходит рано утром, ловить в это время по телефону уже поздно, если попало в отдел доставки, то оттуда легко не выцарапать.
  • Поставить в базе пожелание клиента "не доставлять" они могу только после прохождения таможни.
  • Таможня работает днем и выдает EMS-у наработанное (большим батчем) ближе к вечеру.

Итого: ловить посылку нужно вечерами. Т.е. после появления статуса "импорт" каждый вечер туда звонить, пока не поймаешь ее в состоянии "после таможни". Только в этом состоянии ей могут поставить статус "клиент заберет сам".

Вентилятор для мебели?

В рамках борьбы с кризисом, проапгрейдил полку до полки с дверкой. Запихал туда Antec NSK1380.

В закрытом объеме - сильно греется, если вспомнить что висит оно на теплой стене, то оно вовсе неудивительно. Если дверку приоткрыть, то греется меньше, но пылится.

Отсюда вопрос: а небольшие, тихие и низкооборотные 220-вольтовые вентиляторы бывают? Владею девайсом для проделывания дырок в полках диаметром до 100 миллиметров т.е. всякие форточные конструкции, которые в 2-3 раза больше, мне великоваты.

Шумел камыш

noise.jpg В комментариях к технике мезурбации в очередной раз всплыла тема оценки уровня шума.

Я на эту тему имею сказать следущее: у разных камер наблюдается существенная разница в понимании "чувствительности", что порождает серьезную методологическую проблему при оценке уровня шума.

Сначала о проблеме:

  • Вот, допустим, имеются камеры A и B, примерно одинаковой мегапиксельности и формата кадра.
  • Пусть, для удобства дальнейших рассуждений, максимальный уровень снимаемого сигнала (он же - приблизительно - разрядность АЦП) у этих камер одинаков, скажем 16000.
  • При формально одинаковой установленной чувствительности и одинаковой сцене - экспонометры на камерах покажут одинаковую экспозицию, совпадающую с показаниями внешнего экспонометра (разницей в методиках матричного замера пренебрежем, допустим мы замеряем серую карту спотметром).
  • Дальше мы экспонируем по экспонометру и получаем уровень сигнала в RAW для вышеупомянутой серой карты: для одной камеры - 1100, для другой - 2400 т.е. более чем вдвое (реальный headroom намеряный для современных 20+-мегапиксельных dSLR так и отличается, от 2.7 до 3.8 стопа).
  • В предположении, что уровень шума одинаков, получаем вдвое отличающееся отношение сигнал/шум.
  • Как следствие, при несколько разных методологиях мы можем получить заметно разные результаты (о чем я уже писал): одни напишут, что более шумная камера А, а другие - что камера B.

Другими словами, очень важное соображение о том, что "формальная" и "реальная" чувствительности - это две большие разницы не может игнорироваться методологией.

Сделай, блин, сам

vf-rubber.jpg Армянское радио спрашивают:

А куда вы деваете затычку от видоискателя у фотокамер Canon если используется не родной ремень (и нацепить на ремень не получается)?

Армянское радио отвечает

А мы ее фигачим на липучке в выемку в штативной площадке!

Попытка использовать в этом месте обычную липучку (velcro), впрочем, потерпела полное фиаско: и липучка слабовата и ее клейкий слой не держится ни на дюрали штативной площадки, ни на резине затычки. А вот 3M DualLock (внимание! реклама!) оказался очень даже к месту: жестче и поэтому не отклеивается, держит крепче. Про то, что DualLock-ом удобно крепить фильтры-тросики к крышке чемоданчика я уже писал. Как и о том, что я на этой штуке развешиваю картинки по дому.

Antec NSK1380

CPSNSK1380.jpg Месяца эдак два раздумий и прикидок завершились тем, с чего и начались: домашний сервер пересажен в Antec NSK1380

В плюсе:

  • То, ради чего все затевалось, а именно глубина меньше 40 сантиметров, достигнуто. Теперь на шкаф, где оно живет, можно навесить дверцу, что удалит три больших пылеуловителя (полки шкафа и их содержимое). Реальная глубина, с учетом торчащих из заду проводов - 37 сантиметров.
  • 4 диска влезают.
  • Тихое. Шум создает дополнительная турбинка, шедшая в комплекте, я ее завтра воспитаю. Шум от дисков, наука бессильна. Остальное все очень приличное.

В минусе:

  • Провода питания внутри корпуса реально короткие, я их без удлинителя использовать не могу.
  • Далеко не всякий кулер подойдет.
  • Если сдохнет блок питания, то новый будет ехать месяц или около того.

Отдельное спасибо компании Ф-Центр: в обзоре на их сайте была указана точная модель подходящего к данному корпусу кулера. В знак благодарности, кулер купил у них.

Update: шумят диски, когда буду их менять на побольше, буду выбирать потише и похолоднее. Сейчас 750-гигабайтные WD, выбранные в свое время за скорость.

Ненавижу PayPal

Покупаю через PayPal на круглую сумму $148:

  • Пэйпал радостно думает, "О, Россия", и делает рублевую транзакцию (которую потом у себя радостно конвертирует в USD по недетскому курсу) - это я вижу в выписке с PayPal.
  • Карта долларовая, ВТБ24 не менее радостно списывает с нее по курсу покупки бакса. Это я вижу в SMS-ке из банка.
  • И так 148 долларов становятся 155 с мелочью. Однако, 5% наценки.

При этом, 1 доллар за активацию карты - списали как доллар.

Я где-то с год не пользовался PayPal-ом, интересно давно ли они так?

Таможня берет добро (2)

FTSR.jpg И пьет мозг. 4 часа, не считая дороги, чтобы заплатить 241 рубль. Правда, я сделал ошибку, которая стоила мне минимум двух часов.

Тут в комментариях уже спрашивали на эту тему, поэтому докладываю.

  1. EMS-Почта России не теряла статуса таможенного брокера, поэтому по всем посылкам, стоимость которых до 10000 рублей - все по старому.
  2. Никакой "совсем упрощенной процедуры" для пользователей EMS, о которой мне рассказывали - тоже нет, по сравнению с прошлым годом (судя по форумам) ничего не изменилось.

Все что ниже - относится только к "международным почтовым отправлениям" т.е. к посылкам, которые иду через EMS (если слать из штатов, то в EMS транслируется USPS Express Mail) и, насколько я понимаю, авиапочтой (в котрую транслируется USPS Priority). Я стараюсь пользоваться только EMS, ибо серьезных претензий к ним у меня нет. Кроме того, это московский опыт, у жителей других регионов, судя по форумам, все иначе. Суммирован как мой опыт (очень простой), так и всякие впечатления из форумов, блогов и разговоров в очереди на таможне.

EMS: отслеживание посылок

У EMS-Почта России с сегодняшнего вечера - новый сайт.

В настоящую минуту трекинг на нем - не работает. Вводишь туда номер, а оно показывает данные по совсем другой посылке, даже город назначения другой.

На счастье, работает трекинг на сайте Почты России: ссылка на форму трекинга

Update, сайт EMS вроде починили. А на Почте России добавили капчу, еще вчера не было. Всюду жизнь.

технологическое

По просьбе гугла, все RSS-фиды моих сайтов переведены с feedburner.com на feedburner.google.com (впрочем, вы должны их видеть как feeds.lexa.ru).

Ежели заметите какие-то недоразумения в ближайшие дни - смело гадьте тут в каменты, будем разбираться. Хочется надеяться, что периодические траблы со знаками вопросика вместо русского текста пропадут.

P.S. Читающих данный текст через ЖЖ это все не касается (но отключать трансляцию ради одного текста ужасно лень)

Техника мезурбации

Мы, мезурбисты, народ мускулистый!

Несмотря на всю критику тестов, что оптики, что камер (я вот тоже люблю поругать тесты DPReview), деваться от этого некуда. Большинство фотографов не имеет возможности перепробовать все представленные на рынке модели, а среди имеющегося богатства надо как-то выбирать. А среди критериев выбора качество (вместе с ценой) играет не последнюю роль (хотя я вот выбрал себе штатный зум по цене и весу только что).

Однако большой интерес к теме не подкреплен реальными значимыми результатами. Тестовых данных - много, но какие-то они все противоречивые. Кроме DPReview (претензии к которому многократно обсуждались в комментах в этом блоге), на этом поле отметилась DxODxOmark), ну и естественно отдельные результаты, полученные отдельными тестовыми лабораториями, бывают самыми удивительными.

Зря, батенька, я там такую отверточку спиз....

screwdriver.jpg Купил набор отверток и в целях их опробования пересадил свои кэноновские тильт-шифты на тильт и шифт в одной плоскости.

Впрочем, если быть точным, порядок был немного другим: загорелся повернуть плоскость шифта, посмотрел на винты, посмотрел на имеющиеся отвертки и пошел в магазин за другими, благо магазин на 6 этажей ниже и идти далеко не надо.

Желающим повторить сей нехитрый трюк спешу сообщить:

  • Вам нужна "филлипсовская" отвертка номер 000 с хорошей ухватистой ручкой и никакая другая. Попытка использовать негодный инструмент скорее всего приведет к повреждению шлицов у винтов и все.
  • Технология тривиальная: отвинчиваете 4 винта, крепящие shift-часть к tilt-части, поворачиваете shift-часть на 90 градусов против часовой стрелки, завинчиваете 4 винта. Между контактами на байонете (в shift-части) и диафрагмой (в tilt-части) идет гибкий шлейф управления диафрагмой, не порвите его.

Canon сажает эти винты на краску, чего и вам желаю.

Фотокнижки

Не могу удержаться и не попиарить ЖЖ-community fotobooks (Библиотека Фотографа).

Конечно, это полное пренебрежение авторским правом и вообще нехорошо, однако там попадаются всяческие жемчуга, коих я больше нигде не видел.

Девальвация доменов

RU-Center прислал очень любезное письмо, дескать с 29 января повышаем цену за регистрацию-продление иностранных доменов (.NET, .COM, .ORG, .BIZ, INFO, .CC, .TV, .ME). А на календаре - 20-е.

Разница для COM/ORG - почти 40 процентов удорожания, для остальных доменов не смотрел.

У кого есть свободные электрические (да и обычные) рубли, тот еще может поиграть в игру "защитись от девальвации" и даже немножко выиграть: продлевать NET/COM/ORG можно на любое количество лет, сколько денег не жалко.

Ру-центру, естественно, тоже приятно, они ваши деньги получат сейчас, а не через несколько лет.

SAS vs SATA

dataloss.jpg Меж тем, SAS-овские барракуды вроде как оказались незатронутыми сигейтовским багом с универсальной прошивкой.

Попустило.

Остальным собственникам 7200.11 с прошивкой SD15 рекомендуется обновиться.

Прошивки берут отсюда: http://seagate.custkb.com/seagate/crm/selfservice/search.jsp?DocId=207931, только что-то у меня там сейчас пустая страница, хотя утром еще была жизнь.

Pages

Subscribe to Разное