SEO

A5

А вот интересный вопрос, значит. У запроса A5 частота по wordstat - 16760 за месяц и 3700-4400 по неделям.

Надо бы не забыть через месяц-полтора (точнее, после появления данных за текущую неделю) посмотреть, какая будет частота. Интересно.

Movable Type 4.23

Решил по случаю воскресенья поапргейдить блоговый движок. C Movable Type 4.21 на 4.23.

Обнаружил неприятность: в поиске (включая поиск по тегу) пролюбили локализацию дат. То бишь, независимо от настроек блога, название месяцев пишутся английские, а формат даты тоже тамошний (Месяц, число год).

Пришлось действовать следующим нетривиальным способом:

  • Берем коммерческий дистрибутив MT 4.23 (его раздают бесплатно всем Pronet Members). Коммерческий потому как попытки использовать Custom Fields я не оставляю.
  • Накатываем сверху (с перезаписью файлов) русский дистрибутив
  • Патчим это обычными моим патчами для MT (патч для dirify не нужен, он в русской версии уже есть, закрытие ссылок в комментариях через noindex там тоже есть, но мой последний вариант лучше, хотя его и придется вставить вручную).

В русской версии MT 4.23 пролюблены еще права на исполнение, приходится руками ставить 0755 на mt/*cgi и mt/tools/*

В результате имеем текущее состояние: версия 4.23, даты везде русские. Хотя меня оно уже все сильно достало, вяло думаю, что надо все унести на Drupal. Правда туда придется писать синхронизацию с ЖЖ, что тоже лень делать.

noindex-патч для Drupal 6.x, вторая попытка

В духе нового патча для Movable Type сделал новый nofollow-noindex патч для Drupal 6,x

  1. Сначала надо установить новый вариант предыдущего патча: drupal-noindex-patch2.gz
    После его применения, все страницы, для которых включена фильтрация внешних ссылок, будут иметь ссылки замененными на a href="#link" onClick="return URL-ссылки"
  2. Далее в шаблон страницы, где-то ниже текста комментариев (мы же боремся с ссылками в комментариях, правильно) нужно разместить такой вот javascript-код:
    var links = document.getElementsByTagName('A');
    for(var i=0; i < links.length; i++)
    {
       if(links[i].href.match(/\#link/) && typeof links[i].onclick == 'function'){
            links[i].href=links[i].onclick();        
        }
    }

    После этого наступает счастье: пользователи ничего не замечают (ну, кроме тех, у кого выключен Javascript, у тех после каждой ссылки появляется слово [link]), а поисковые машины индексируют только текст ссылки, но не учитывают ее как ссылку. Чего мы и добивались.

noindex-патч для MovableType, 4-я попытка

По совету Николая Сиварева удалось избавиться от главного недостатка моего предыдущего noindex-патча для Movable Type: неудобства при открытии ссылки по правой кнопке.

Правда патч усложнился и теперь состоит из двух частей.

  1. На Movable Type нужно наложить вот этот вот патч: patch-nofollow-img-js2.gz.
    В результате все внешние ссылки получат вид <a href="#link" onClick="return 'http://link-target';">
  2. В темплейт, где-то в районе footer нужно добавить следующий Javascript-код:
     
    var links
  3. ...

Бешеные роботы возвращаются

crazy-robots.jpg

Я про это уже писал, более того мне клялись в личных беседах, что роботов умеют фильтровать и вот-вот wordstat починят. Однако практика показывает, что не починили и какой-то бешеный робот 150 раз в день проверяет позиции по вышепоказанному чудовищному запросу.

Я, собственно, повторно клоню к тому, что ориентироваться на статистику частот запросов нужно с большой осторожностью. Ну ладно, с бугорчатой прокладкой все сходу понятно, ну а сколько роботы вносят в те же "пластиковые окна" с месячной частотой в пару сотен тысяч? SEO-шники, чтите квантовую физику, мать вашу.

Drupal: второй патч для noindex

Помимо стандартного HTML Filter, который пришлось править для защиты от ссылочного спама, в Drupal обнаружилось еще одно аналогичное место: заголовок комментария.

Для зарегистрированных на сайте пользователей, имя пользователя является ссылкой на профиль, если читающий не залогинен, то даже и ссылки нет. Для сторонних же пользователей, указавших при комментировании линк на сайт, имя является ссылкой на этот сайт. Конечно, эта ссылка защищена от гугла через rel=nofollow, но наши поисковики такого не понимают, а хотят noindex.

Патч: drupal-themeinc-noindex.diff.gz

Так как я не вижу никакого смысла в индексировании Яндексом юзерских ников анонимов, то ухищрения с яваскриптом не нужны, просто noindex и все.

nofollow-noindex патч для Drupal 6.4

Ссылками в комментариях спамят не только этот блог, но и мои сайты на Drupal (libraw.org,gpgpu.ru и так далее). В отличие от MovableType, антиспам-средства у Drupal развиты еще меньше, приходится пропускать без модерирования только зарегистрированных юзеров, но и это не вполне помогает.

Мировая часть проблемы в Drupal решена - ко всем ссылкам в юзерском контенте можно добавлять rel=nofollow, отчего спамить под гугл становится неинтересно. Остается яндекс, который rel=nofollow не понимает (насколько мне известно), но зато понимает "рамблеровский" (придуманный Димой Крюковым) тег <noindex>.

Сооответственно, нужно добавить три строчки кода к modules/filter/filter.module:

Сделано примерно так же, как для Movable Type:

  • Сама ссылка заменяется на явоскриптовую
  • В noscript,noindex, a.. rel=nofollow помещается слово [link] которое и становится ссылкой для Javascript-disabled people (стандартные стили у Drupal такие, что картинка переносится на новую строку и красивая стрелка не получается).

Стандартный дисклеймер. Если вы не знаете что такое патч, то вам все вышеописанное не нужно.

Ссылками в комментариях спамят не только этот блог, но и мои сайты на Drupal (libraw.org,gpgpu.ru и так далее). В отличие от MovableType, антиспам-средства у Drupal развиты еще меньше, приходится пропускать без модерирования только зарегистрированных юзеров, но и это не вполне помогает.

Мировая часть проблемы в Drupal решена - ко всем ссылкам в юзерском контенте можно добавлять rel=nofollow, отчего спамить под гугл становится неинтересно. Остается яндекс, который rel=nofollow не понимает (насколько мне известно), но зато понимает "рамблеровский" (придуманный Димой Крюковым) тег <noindex>.

Сооответственно, нужно добавить три строчки кода к modules/filter/filter.module:

Сделано примерно так же, как для Movable Type:

  • Сама ссылка заменяется на явоскриптовую
  • В noscript,noindex, a.. rel=nofollow помещается слово [link] которое и становится ссылкой для Javascript-disabled people (стандартные стили у Drupal такие, что картинка переносится на новую строку и красивая стрелка не получается).

Стандартный дисклеймер. Если вы не знаете что такое патч, то вам все вышеописанное не нужно.

nofollow-патч для MovableType, 3-я попытка

После высказанной критики, вчерашний патч пришлось усовершенствовать:

  • Картинка со ссылкой убирается в <noscript>, большинство посетителей ее не увидят.
  • Переход по ссылке делаем яваскриптом, через window.location=

Патч вот: patch-nofollow-img-js.gz

Понятно, что есть недостатки:

  • В статусной строке не отображается URL. Это тоже лечится яваскриптом, но уже лень т.к. просто присвоение windows.status= не работает в Firefox/Opera, нужно таймеры ставить.
  • Потерялось открытие ссылки в отдельном окне. Можно, наоборот, сделать через window.open, но тогда потеряется открытие в текущем. Счастья нет.

В этом блоге, впрочем, используется несколько другая версия патча, которая оставляет ссылки на мои сайты прямыми, а остальные открывает в новом окне. Не публикую т.к. не нашел разумного способа вытащить хотя бы URL текущего блога в том месте, где зовется nofollowfy();

go.mail.ru &#8800; yandex.ru ?

Принято считать, что поисковая выдача на Mail.ru и поисковая выдача Яндекса - это одно и то же (с точностью до региональных настроек, которые разные). И последние года два это было так с какой-то точностью.
При этом трафик с go.mail.ru и с Яндекса был сильно скоррелирован. Аудитория, конечно, заметно отличается, поэтому по конкретным запросам отношение частот переходов не вполне соответствовали общерунетовскому среднему 1:6 (или около того, отношение довольно быстро меняется в сторону mail.ru), но выдача, насколько я ее смотрел, была одинаковой.

В последнюю неделю ситуация кардинально изменилась, на картинке среднесуточный трафик на блог:

blog-weekavg.png
Mail.ru стало давать в разы больше трафика, чем Яндекс, причем всего по нескольким запросам. Удивительнее всего то, что в мейловой выдаче отсутствует очевидный лидер по этому запросу (и это не мой блог :).

При проверке по другим запросам - выдача одинаковая по средне- и низкочастотникам, но по некоторым высокочастотникам - отличается. Mail редактирует поисковые результаты по избранным запросам?

Еще про nofollow в MovableType 4

Как мне тут справедливо указали, настройка "приделывать rel=nofollow к комментариям и трекбекам" не влияет на содержимое тега CommentAuthorIdentity

Пятиминутный просмотр исходников показал, что это бага в MovableType, в функции реализующей вышеуказанный тег просто пропустили одну строчку

Прилагаемый патч решает эту проблему. Естественно, после приложения патча нужно перебилдить все странички.

Вот и пригодился ProNet-овский аккаунт. Я через него засабмитил тикет, посмотрим чем кончится.

Да, если вы используете мой патч про noindex, то ссылки в обсуждаемом теге будут обвернуты и noindex тоже

Update: из саппорта ответили "читайте документацию" (см. комментарии). И ведь они правы.

Грозным видом соблазнят гвозди марки "150"

С сайта ООО "Реальные гвозди"

 

Для любовниц и подруг,
Гвозди "200" - лучший друг...
Можно в голову забить,
Чтоб извилины развить.

...

Гвозди марки "50"
Вас собою удивят.
Этот сорт среди гвоздей,
Для коробок и дверей.

...

Гвоздь "180" хорош
Рыбу он бросает в дрожь.
....

И так далее, про 26 размеров гвоздей.

И подумалось мне, что свои ЕСТЕСТВЕННЫЕ ССЫЛКИ, которых сейчас на них понаставят, эти ребята честно заработали.

Бешеные SEO-роботы

Не секрет, что SEOшники массово снимают позиции подопечных сайтов в поисковой выдаче. Влияние этих роботов на частоты низкочастотных запросов достаточно очевидно: если позицию по запросу с "реальной частотой" 10 проверять каждый день, то частота станет 40.

Естественно, поисковые машины таких проверяльщиков видят. Народ ведь не знает меры, представители Яндекса говорили о сотнях тысяч запросов с одного IP за несколько часов/сутки.

В то же время, считается что на частоты средне- и особенно высокочастотников SEO-роботы влияют мало. Действительность же превосходит...

Пересчет Google PageRank в октябре 2007 года

В день 90-летия Великой Октябрьской Социалистической Революции октябрьский пересчет Google Pagerank был изучен, препарирован и исчислен, читайте и наслаждайтесь.

Никаких содержательных выводов, впрочем, не произведено, только анализ циферок в разных разрезах.

Пересчет Google PageRank: пыль еще не улеглась

Как многие знают, Google пересчитал pagerank, причем преимущественно в минус :). Однако еще в середине недели цифирки колебались, анализировать что насчитали явно рано, надо еще какое-то время подождать.

На сегодняшний день, впрочем, в Рунете видно только три сайта с честным PR8: liveinternet.ru, ihep.ru и spbu.ru. Два очень старых, а один - очень цитируемый. Rambler из восьмерок выпал, а больше честных восьмерок и не было, либо зеркала перечисленных выше, либо зеркала зарубежных сайтов (включая и Томь-Усинский завод железобетонных конструкций, а ведь наверное кто-то за такой PR c них денег взял....).

На сегодня среди восьмерок есть еще 8 зеркал зарубежных сайтов: 4 зеркала skype.com и еще 4 одиночных зеркала зарубежных сайтов.

Да, стандартное наблюдение над тем, какие страницы/сайты получили PR:

  • страница http://blog.lexa.ru/2007/10/02/ - получила PR
  • страница http://blog.lexa.ru/2007/10/04/ - не получила
Таким образом, для пересчета взяты данные за 2-3 октября. Примерно такая же ситуация была весной: 28 апреля начали публиковать данные с датой отсечки около 3-го апреля.

Movable Type 4: nofollow и noindex

К MT3 был отдельный плагин nofollow, который приписывал атрибут rel=nofollow ко всем ссылкам в комментариях.

В четвертой версии эта функциональность есть прямо в самом движке. Ее несколько расширили, в частности в комментарях от доверенных комментаторов можно такую функциональность выключить (и тем их поощрить).

Естественно, о российских реалиях и теге <noindex> в SixApart не знают. Прилагаемый

патч
решает эту проблему. На глаз - работает.

P.S. Если вы не знаете что такое "патч", то он вам не нужен

Ссылочное ранжирование в Рунете, часть 4: трафик по тематикам

Очередная статья на тему SEO: Ссылочное ранжирование в Рунете, часть 4: тематический трафик.
Допустим, у нас есть данные о частотах запросов (а они есть), тогда по ним можно посчитать очень интересное.
  • Берем запросы и раскладываем их по тематикам. Да, полноты не добиться, но больше половины - разложим. Получим оценку поискового трафика по данной теме.
  • Поделим ссылочные бюджеты на этот трафик - получим оценку стоимости привлечения пользователей из поисковиков.

Все это проделано в статье.

Выводы, как обычно, довольно любопытные:

  • Если смотреть по тематике, а не по конкретному запросу, то стоимость привлечения клиентов через SEO в разы и порядки дешевле, чем привлечение их же контекстной рекламой.
  • Естественно, самые дорогие клиенты - в узких тематиках. Мало запросов, высокая конкуренция и так далее.
  • Судя по всему, продвижением по низкочастотным запросам занимаются мало, по многим крупным и интересным тематикам (Автомобили, например) количество уникальных текстов ссылок на порядок меньше количества формулировок запросов. При том, что текст ссылки может быть уникальным за счет названия сайта-клиента.

Зачитать текст

Тематические бюджеты: изменения и дополнения

Достаточно плодотворная дискуссия в ru_seo, плюс множество персональных обсуждений убедили меня в том, что статья про ссылочные бюджеты по тематикам нуждается в некоторой доработке.

Что и было сделано. Встречайте Ссылочное ранжирование в Рунете, часть 3b: тематические бюджеты с изменениями и дополнениями.

Изменения и дополнения:

  • Не учитываем ссылки с "мегапорталов" - сайтов с формальной ценой ссылки более $500
  • Помимо топовых бюджетов считается среднее для Top-10 бюджетов

Напоминаю, что относиться к этим данным следует весьма осторожно:

  • многие сайты продвигаются по многим темам сразу;
  • многие сайты продвигаются не только мордами;
  • большой бюджет на ссылки не гарантирует успеха в продвижении.

Ссылочное ранжирование в Рунете, часть 3: тематические бюджеты

Продолжаем палить SEO-темы: Ссылочное ранжирование в Рунете III: бюджеты по тематикам. Если в двух словах, то все просто:
  • Берем все морды, выделяем те, где ссылки что-то стоят (и этих ссылок не слишком много и не слишком мало). Стоимость каждой ссылки считаем по волшебной формуле.
  • Выкачиваем все страницы, на которые ведут эти ссылки.
  • Автоматически, с помощью секретной технологии Семантическое Зеркало, определяем тематики выкачаных страниц и тематики ведущих на них ссылок.
  • Распределяем цены ссылок по определившимся тематикам.
  • Сортируем по месячному бюджету, добавляем в суп сайты - лидеры тематик по бюджетам.

Подробности читать тут.

Получается достаточно любопытно. Скажем, я знал что на пластиковые окна тратятся тысячи в месяц, но семь килобаксов только на морды - это уже за гранью добра и зла.

Новый PageRank

Google начал публикацию новых значений toolbar Pagerank.

Несложная прикидка показала, что rank получили страницы, проиндексированные 2-3-го апреля и ранее. Более новые страницы - не получили. Вот например:

  • http://www.lexa.ru/nginx-ru/msg10113.html - 3 апреля, 00:59 - не получила PR
  • http://www.lexa.ru/nginx-ru/msg10112.html - 3 апреля, 00:28, PR3

Сильно оперативнее, чем в в прошлый раз, когда в начале января были учтены страницы за 12-13 ноября.

Ссылочное ранжирование в Рунете II: тексты ссылок, реципиенты ссылок

Продолжаю упражнения со ссылочной базой с "морд" сайтов рунета:
Ссылочное ранжирование в Рунете: реципиенты ссылок, тексты ссылок.

Рассмотрены:

  • получатели (реципиенты) ссылок с главных страниц;
  • наиболее частые тексты ссылок;
  • наиболее частые слова в текстах ссылок;
  • какие бюджеты тратятся на "морды"
  • какие тематики наиболее конкурентные
Обсуждать можно в коментах к этой записи.

Pages

Subscribe to SEO