яндекс

О картографии (в исполнении яндекса)

А на этой картинке, дети, вы видите фрагмент карты Монголии в исполнении Яндекса:
Мы видим, как мистическим образом перемешались слова в названиях озер. Тут тебе и "нур" (классическое русское написание для бурятской топонимики, на советских картах Монголии преимущественно оно), и "нуур" (монгольское написание) и вот еще пожалуйста "лейк".

Но вот каким образом Хара-ус-нур (написание с российской карты, достаточно близко к тому, как аборигены произносят, если спросите так - поймут) стал Кар-Сша-Лейком - вот это, действительно, загадка. Сдается мне, тут какой-то двойной OCR приложил руку. Сначала с русской карты в английскую транскрипцию, а потом - обратно. С нечетным количеством ошибок каждый раз.

Update: Тоботрас разгадал. Это Энциклонги

А, да, еще по этому фрагменту. Озера "Ульгий" - нет. Там, я извиняюсь, еще один Хара-Ус-Нур (я думаю, тут дело не в бедности монгольской топонимики, а в том, что советские топографы разницы между чем-то вроде 'ус' и 'уус' - не уловили), а Ульгий - название близлежащей деревни, которой на карте нет (и не путать с городом Баян-Ульгий). Но написано - синеньким, как для озера, а не черненьким.

Нет, понятно что для Монголии даже идеи пользоваться картами Яндекса не может возникнуть, но ведь у них, поди, и для других стран - аналогичная фигня.

.... и сразу тонет

Решил попробовать новомодный Яндекс.Store.

Сходил на m.ya.ru/store, скачал, сказал установиться. Подождал (не знаю сколько) - не поставилось. Повторил, засек время. Вот уже 20 минут показывает градусник и ничего больше не происходит (еще батарейка заметно тает).

Ссылка в тему: http://www.litmir.net/br/?b=26842&p=6

P.S. Я надеюсь на то, что Яндексовский мониторинг блогов сработает и они сделают что-нибудь. Убьются ап стену, например.

P.P.S. Galaxy Note (первая), Андроид 4.0.4

"я не знаю, был ли я все еще воскресным или уже понедельничным"

Update: первое место на конкурсе известно кого занимает PHP, где таблица таймзон - вшитая, а не системная. Всех бы убил, да. pecl-timezonedb спасает.

Приз зрительских симпатий за перевод часов получает Яндекс-почта.

Рассказываю:

  • На часах 11:26 (правильного времени), вхожу в Я-почту, вижу там внизу "последний вход в 10:54"
  • Действительно, в 10:54 я туда заходил, написать сам себе письмо и посмотреть на даты в заголовках (и все было прилично).
  • Выхожу (на часах 11:26), вхожу, выхожу, вхожу.
  • Надпись внизу остается все та же, про 10:54.
  • Повторяю еще и еще раз, наконец в 11:55 добиваюсь, надпись меняется на 11:26 (время начала экспериментов). Хотя с 11:26 я входил и выходил раз 10 минимум (а в промежутке 10:54-11:26 - нет).
  • Подозреваю, что в следующий раз "время последнего входа" сменится в 12:26 MSK, через полчасика проверю. Yes! Теперь оно залипло на 11:56

Я, естественно, не знаю в чем там причина, но предполагаю что

  • На части серверов время таки перевелось (часть - честно ставит правильный заголовок Date в почте, да и на глагне у Яндекса более-менее все в порядке)
  • В процессе работы Яндекс-Почты возникает передача (или разбор, или хранение) локального времени без учета таймзоны.

    Или, хитрее (и хуже): таймзона передается и анализируется, но в виде буковок MSK/MSD. А MSK у нас раньше была +0300, а стала +0400.

В ситуации, когда на серверах - разная таймзона, либо разное описание MSK (а что-то из этого, очевидно, имеет место быть), получается веселуха.

Второе место у телефона на WinMobile 6 (или 6.5, не вдавался), сообщение: произведен переход на летнее время.

А мораль в той басне понятно какая (это я не Яндексу, там сами разберутся, ибо умные):

  • Или хранить, передавать и т.п. все в UTC, а только визуализацию делать в локальном времени.
  • Или, в крайнем случае, в формате HH:MM:SS +OFST, но тогда честно разбирать смещение.
  • Но никаких HH:MM:SS (локальных) или HH:MM:SS TZNAME, потому что смысл TZNAME имеет свойство меняться, а разбирать время по полной истории всех таймзон - это же удавиться.

О корпоративной многоголовости

В приступе шопоголии иду на Яндекс-Маркет, зырю на интересующий меня объектив, жмякаю в ссылку в блоке где купить (которая подсвеченна как кликнутая):

После чего вижу вот это вот:

В этой связи меня интересуют три вопроса:

  • Абстрактный: а с рекламодателя деньги за такой клик списываются?
  • Еще более абстрактый: это общая черта больших компаний, когда правая голова и левая думают о разном?
  • Конкретный: $600 и купить прямо сегодня или $470 и B&H и дней через 10?

P.S. Прокликал все ссылки "где купить" у этого товара - они все такие, то есть это фишка Маркета, а не сайта продавца. На других товарах такого эффекта нет.

P.S. "Все цены: 5, на карте: 7" тоже изрядно рвут крышу, но там хоть материалистическое объяснение есть.

Update: воспользовался советом из каментов и купил с рук, новое. Оказывается, есть в первопрестольной люди, которые возят оптику для micro-4/3. Получилось как на B&H по цене, но на следующий день, а не через 10. Панасовский 14/2.5 - прикольный....

гигабайты формул

Для тех, кому интересна внутренняя кухня: сложность формулы ранжирования выросла почти в два с половиной раза, и теперь объем формулы составляет 280 Мбайт (совсем недавно, в июле 2010 года, Илья Сегалович на конференции SIGIR рассказывал, что формула ранжирования, занимавшая в 2006 году 0,02 килобайта, разрослась до ~120 Мбайт, а теперь ему снова придется перерисовывать слайд).

отсюда.

По всей видимости, в Яндексе поточнее посчитали число π?

Опять про wordstat

Яндекс поправил проблему с Wordstat, о которой я писал на позапрошлой неделе, настало облегчение.

Но сам пример с икея/икеа настолько хорош, что заслуживает еще одной заметки.

На картинках ниже мы видим помесячное распределение частот для запросов "икея" (верхняя картинка) и "икеа" (нижняя).

Картина, надо сказать, очень любопытная:

  • "естественным" запросом
  • ...

Верните wordstat!

Если кто знает, кого и как пнуть, вы там пните, не стесняйтесь.

А пока - Яндекс пролюбил wordstat.

Запрос икеа, частота 193 тысячи за месяц, все нормально, список слов:

Запрос 'икея', частота в полтора раза выше (304 тысячи), а вместо списка слов - хрен:

Ну, за репрезентативность

В кулуарах Хайлоада представители Спайлога не стеснялись утверждать, что их тренды - репрезентативны, а глобальная статистика - хороша. Не хочется обижать хороших людей, но правда дороже.

Вот как выглядит верхушка топа поисковиков за октябрь по версии Spylog Тренды:

spylog-search.png

Эти данные неплохо согласуются с полной статистикой LiveInternet, но вот данные о поисковых фразах заставляют задуматься о репрезентативности всей конструкции.

Бешеные роботы возвращаются

crazy-robots.jpg

Я про это уже писал, более того мне клялись в личных беседах, что роботов умеют фильтровать и вот-вот wordstat починят. Однако практика показывает, что не починили и какой-то бешеный робот 150 раз в день проверяет позиции по вышепоказанному чудовищному запросу.

Я, собственно, повторно клоню к тому, что ориентироваться на статистику частот запросов нужно с большой осторожностью. Ну ладно, с бугорчатой прокладкой все сходу понятно, ну а сколько роботы вносят в те же "пластиковые окна" с месячной частотой в пару сотен тысяч? SEO-шники, чтите квантовую физику, мать вашу.

Бешеные SEO-роботы

Не секрет, что SEOшники массово снимают позиции подопечных сайтов в поисковой выдаче. Влияние этих роботов на частоты низкочастотных запросов достаточно очевидно: если позицию по запросу с "реальной частотой" 10 проверять каждый день, то частота станет 40.

Естественно, поисковые машины таких проверяльщиков видят. Народ ведь не знает меры, представители Яндекса говорили о сотнях тысяч запросов с одного IP за несколько часов/сутки.

В то же время, считается что на частоты средне- и особенно высокочастотников SEO-роботы влияют мало. Действительность же превосходит...

О роли Яндекс.Каталога в Яндексе.Цитирования

Продолжение-дополнение предыдущей статьи:

О роли Яндекс.Каталога в Яндексе.Цитирования

В предыдущей статье осталась нераскрыта тема Яндекс.Каталога: повлияло ли наличие сайта в нем на изменение ТИЦ при декабрьском пересчете.

Пришлось написать отдельный текст на эту тему, наслаждайтесь

Яндекс.Цитирования сайтов рунета

Наваял очередную нетленку Яндекс.Цитирования сайтов рунета в 4-м квартале 2006 г - обзор изменений ТИЦ с октября по январь по ~200 тысячам сайтов. Основные выводы:
  • ТИЦ серьезно упал, примерно на четверть (если брать средние значения)
  • В наибольшей степени это коснулось сайтов с относительно высокими ТИЦ, если ТИЦ был более 100, то с вероятностью 85% он упал
  • Письма из поддержки Яндекса "тиц упал у некоторых сайтов" - это явное преуменьшение размеров проблемы
наслаждайтесь чтением
Subscribe to яндекс