Верните wordstat!

Если кто знает, кого и как пнуть, вы там пните, не стесняйтесь.

А пока - Яндекс пролюбил wordstat.

Запрос икеа, частота 193 тысячи за месяц, все нормально, список слов:

Запрос 'икея', частота в полтора раза выше (304 тысячи), а вместо списка слов - хрен:

И это не только с икея/икеа так (просто пример уж больно хорош), похоже на недополуприкрученный корректор опечаток, ибо по запросу "икея" коррекция опечатки предлагается.

Посылаю им лучи поноса....

Comments

Спокойствие, только спокойствие!
Уже смотрим.

Алексей, проблема оказалась несколько серьезнее, чем мы думали, починка займет несколько дней.
Я Вам обязательно напишу, когда будет релиз с исправлениями.
Извините за доставленные неудобства.

--
C уважением, Алексей Кабанов
http://sottovoce.moikrug.ru/

Я, на самом деле, не тороплюсь.

Но если я про колдунщика угадал - зашлите мне в офис пирожок :)

Алексей, в понедельник был выложен новые релиз - и с починкой этого бага, и рядом других изменений.
Насчет догадок позвольте мне промолчать. :-)

Надеюсь, что далее подобных проблем с сервисом не случится.

Спасибо, полегчало.

Хотя относительные (относительно друг друга) частоты слов икеа/икея меня теперь удивляют.

Алексей, пользуюясь тем фактом, что вы тут отвечаете :), у меня еще вопрос.

В помесячной статистике wordstat нет января-февраля прошлого года. Есть какие-то шансы ее увидеть? Для "сезонных запросов" (вроде горнолыжных, например), это очень интересные данные, а на текущий момент никакого января-февраля (ни 2008 ни 2009) в открытом доступе нету.

Да, с январём-февралём 2009 и правда не очень аккуратненько вышло и чуть было не потеряли - уже пересчитываются, планируем выложить в понедельник.
Касательно споров с Мишей Ильиным в соседнем топике - алгоритм подсчета данных действительно немного менялся в марте 2009 года - там ранее даже была на этом месте красная линия с соответствующей подписью, которую позже убрали.

Алексей, мой поинт в том, что какое-то изменение происходит прямо вот в данный момент.

Т.е. вот два графика:
http://wordstat.yandex.ru/?cmd=weeks&scmd=abs&text=%D0%B8%D0%BA%D0%B5%D1...
http://wordstat.yandex.ru/?cmd=weeks&scmd=abs&text=%D0%B8%D0%BA%D0%B5%D0...

Понятно, что то что от одного убавили - другому прибавилось (плюс-минус общий тренд). *НО ПОЧЕМУ* ? Чтобы пользователи за месяц перевоспитались - не верю. Если это подстановка собственно в поисковике - то почему не на 100%, а только частично (тем более что подстановки нет, есть "может быть вы искали...").

Мучаюсь ужасно, прямо готов на семинар Яндексовский по рекламе сходить и вопрос задать.....

Алексей, ну, например, одна из гипотез:

Я здесь не готов точно гарантировать, что именно оно, так как мог и пропустить недавно какие-то изменения нашего suggest, но в качестве одной из гипотез оно вполне подходит - частотность слова для выпадающего меню могла изменится, и "икея" полностью проиграла "икеа".

Я в понедельник еще уточню у коллег, которые им заведуют, но, такой вариант вполне возможен, кажется?

Гипотеза ничему не противоречит (переключение, получается, произошло примерно 25 декабря, судя по наблюдаемым данным).

Однако если влияние *такого* масштаба, то страшная штука этот ваш suggest.

Непонятно только, отчего выиграла менее частотная форма (до ~25 декабря неканоническая "икея" была более частотной), ну да могли слово в словарь внести.

Есть правда одно "но". Вот есть такие неканонические "однокласники" (с одним с). Им никакой suggest явно не помогает:

http://wordstat.yandex.ru/?cmd=weeks&scmd=abs&text=%D0%BE%D0%B4%D0%BD%D0...

Т.е. тоже есть большой скачок год с лишним назад:
http://wordstat.yandex.ru/?scmd=abs&cmd=months&text=%D0%BE%D0%B4%D0%BD%D...

Но он не такой силы, не в несколько раз, а всего в два.

Я еще поищу примеров частотных опечаток, тут подумать надо. Попрошу на следующей неделе у Ермакова историю по подсказочнику ( http://analyzethis.ru/?analyzer=correct&location=ru&lang=ru ) и помедитирую, многие ходы то записаны....

Ну вообще, за Вашими сообщениями мы следим и Вы уже много раз всякое интересное у нас находили. Нам остается во многом внимать и исправлять погрешности. :-)
Саггест это был или нет, но если конкретные примеры ошибок все же найдутся, то буду благодарен за их описание на sottovoce@yandex-team.ru, будем копаться в сырых логах. Wordstat - очень любимый нами сервис и именно в нём неправильных данных не хотелось бы.
Ну а насчет апдейтов словаря подсказок за последние месяц-два я смогу уточнить лишь в понедельник.

Алексей, выяснилось, что я угадал - ребята из поиска проверили выкладки, и ровно 25-го декабря был новый релиз саджеста, где из подсказок "икея" исчезла.

Да уж, величина эффекта чудовищная.

Ну вот, пока все это писал, разработчики все же решили выкатить релиз в пятницу.
Все данные за январь и февраль 2009 вроде уже на месте. :-)
И отчеркивание с марта 2009 тоже вернули, чтобы сравнивали данные осторожнее.

О, спасибо!

Так с икея/икеа в прошлом марте - еще красивее.

Хыхы, как вы скоры на лучи :))

А оно не сегодня сломалось.

Но я честно подождал первого рабочего дня, в надежде, что это какой-то случайный глюк.

кстати, выкинь облако тегов из индексации поисковиками.
найти ничего невозможно -- на любой странице все ключевые слова присутствуют

Я в ближайшие дни свой поиск прикручу, правильный, кошерный и быстро обновляющийся.

На новом двигле оно не так обидно.

Ето не корректор, а лемматор, он глючный. Икеть, икей, икея -> икея.

Да, знаю. Интить - интит - интим.

Или минута - минут - минЕт.

Но я давно у Я. не видел таких проблем, минет продавался в Маркете уже года четыре тому как. Или три.

Ето ж словарь, проблема лечится по мере поступления. Сочить и интить евро- и афрорекламодателей всегда хватало, а икея видно только созрела, вот и всплыло.

нененене, Дэвид Блейн, это проблема скорее в области колдунщика или чего-то подобного.

Ищем "гугл":
http://yandex.ru/yandsearch?&text=%D0%B3%D1%83%D0%B3%D0%BB
На первом месте, сюрприз, google.ru (клянусь, на этом сайте не таких слов, корпоративная политика)

Ищем его же в вордстате:
http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B3%D1%83%D0%B3%D0%B...

Та же фигня, что и "икея" - списка запросов нет, суммарная частота есть.

Где-то кто-то кого-то переколдовал.

P.S. Ставлю диагнозы телепатическим путем

Хорошее нашел, скринить лень. В настройках япоиска взводим чекбокс "показывать поисковые подсказки" и гагл! Курить выпадающий список.

то что в Я. называют гуугле гаглом - это такой известный мем с роем.ру.

Вслед за пользователями. Они и не скрывают.

Это какие-то специальные, пользователи, выведенные в секретных лабораториях.

"гугл" спрашивают 520 тыс. в месяц пруфлинк

"гагл" - 135 раз (не тысяч!) в месяц пруфлинк

Не, я понимаю, что статистика в вордстате пирамидальная и все такое, но не в 4 тысячи раз же. Даже гугол спрашивают 16 тыс раз, в 125 раз чаще гагла.

Я не о том. Рефлексия была изначально про пользователей http://iseg.livejournal.com/84583.html и вроде бы задолго до Роема, который обратил все это в глум, как водится

И правильно обратили - если 135 запросов в месяц, то это какие-то внутренние Яндексовские рефлексии и метания.

Я ниже ответил. 4 года назад неофиты поиска хуже знали как правильно пишется(произносится) ета диковина, и соотношение, допускаю, было другим.

Миш, ну вот ты - участнег событий и тебе виднее, конечно.

Но с кочки зрения стороннего наблюдателя из 2010-го года, гагл в подсказке выглядит как такой крупный чисто Яндексовский таракан. Повод похихикать (посмотрев на текущую статистику).

Про 2006-й год мне трудно что-либо сказать.

Леш, возможно, сейчас тут и есть элемент стеба, вроде известного привета конкурентам под Ctrl+A.
Но с точки зрения юзерфрендли частотность запроса не должна влиять на требования к качеству переколдовки. И если даже несколько юзеров (из 135) вводит стринг гагл, интересуясь именно поисковиком, а не мемом, не подсказать им "возможно, вы ищете гугл?" - эвил по сути такой же, как не подсказать инсулин ищущему "энсуллин" диабетику.

Но с точки зрения юзерфрендли частотность запроса не должна влиять на требования к качеству переколдовки

Только если есть бесконечные патроны ресурсы и переколдовка по более частотным запросам сделана не хуже. А это не так на текущий момент.

Тут как раз тебе виднее)

Лично мне в плане юзерфрендли очень хочется в настройках иметь возможность отключить переколдовку опечаток, особенно принудительную. Не думаю, что эта опция повияет на урожайность Директа.

Т.е. по ссылкам 4 года назад странички открывались, конечно же, другие. Но суть я их хорошо помню. По второй ссылке - как часто это слово встречается в вопросах на форумах, по первой - что и вебмастера грешат. Все это обсуждалось именно в контексте колдунщика опечаток, так что я напрасно иронизировал. А мем вроде бы сначала не на роеме появился, а в выхлопах на вебпланете. Он и впрямь пришелся)