Решил по случаю воскресенья поапргейдить блоговый движок. C Movable Type 4.21 на 4.23.
Обнаружил неприятность: в поиске (включая поиск по тегу) пролюбили локализацию дат. То бишь, независимо от настроек блога, название месяцев пишутся английские, а формат даты тоже тамошний (Месяц, число год).
Сначала надо установить новый вариант предыдущего патча:
drupal-noindex-patch2.gz
После его применения, все страницы, для которых включена фильтрация внешних ссылок, будут иметь ссылки замененными на a href="#link" onClick="return URL-ссылки"
Далее в шаблон страницы, где-то ниже текста комментариев (мы же боремся с ссылками в комментариях, правильно) нужно разместить такой вот javascript-код:
var links = document.getElementsByTagName('A');
for(var i=0; i < links.length; i++)
{
if(links[i].href.match(/\#link/) && typeof links[i].onclick == 'function'){
links[i].href=links[i].onclick();
}
}
После этого наступает счастье: пользователи ничего не замечают (ну, кроме тех, у кого выключен Javascript, у тех после каждой ссылки появляется слово [link]), а поисковые машины индексируют только текст ссылки, но не учитывают ее как ссылку. Чего мы и добивались.
По совету Николая Сиварева удалось избавиться от главного недостатка моего предыдущего noindex-патча для Movable Type: неудобства при открытии ссылки по правой кнопке.
Правда патч усложнился и теперь состоит из двух частей.
На Movable Type нужно наложить вот этот вот патч: patch-nofollow-img-js2.gz. В результате все внешние ссылки получат вид <a href="#link" onClick="return 'http://link-target';">
В темплейт, где-то в районе footer нужно добавить следующий Javascript-код:
var links = document.getElementsByTagName('A');
for(var i=0; i < links.length; i++)
{
if(links[i].href.match(/\#link/) && typeof links[i].onclick == 'function'){
links[i].href=links[i].onclick();
}
}
После чего наступит одержание и полное счастье. Подобный патч к Drupal тоже в ближайшее время изготовлю.
По совету Николая Сиварева удалось избавиться от главного недостатка моего предыдущего noindex-патча для Movable Type: неудобства при открытии ссылки по правой кнопке.
Правда патч усложнился и теперь состоит из двух частей.
На Movable Type нужно наложить вот этот вот патч: patch-nofollow-img-js2.gz. В результате все внешние ссылки получат вид <a href="#link" onClick="return 'http://link-target';">
В темплейт, где-то в районе footer нужно добавить следующий Javascript-код:
var links = document.getElementsByTagName('A');
for(var i=0; i < links.length; i++)
{
if(links[i].href.match(/\#link/) && typeof links[i].onclick == 'function'){
links[i].href=links[i].onclick();
}
}
После чего наступит одержание и полное счастье. Подобный патч к Drupal тоже в ближайшее время изготовлю.
Я про это уже писал, более того мне клялись в личных беседах, что роботов умеют фильтровать и вот-вот wordstat починят. Однако практика показывает, что не починили и какой-то бешеный робот 150 раз в день проверяет позиции по вышепоказанному чудовищному запросу.
Я, собственно, повторно клоню к тому, что ориентироваться на статистику частот запросов нужно с большой осторожностью. Ну ладно, с бугорчатой прокладкой все сходу понятно, ну а сколько роботы вносят в те же "пластиковые окна" с месячной частотой в пару сотен тысяч? SEO-шники, чтите квантовую физику, мать вашу.
Для зарегистрированных на сайте пользователей, имя пользователя является ссылкой на профиль, если читающий не залогинен, то даже и ссылки нет. Для сторонних же пользователей, указавших при комментировании линк на сайт, имя является ссылкой на этот сайт. Конечно, эта ссылка защищена от гугла через rel=nofollow, но наши поисковики такого не понимают, а хотят noindex.
Ссылками в комментариях спамят не только этот блог, но и мои сайты на Drupal (libraw.org,gpgpu.ru и так далее). В отличие от MovableType, антиспам-средства у Drupal развиты еще меньше, приходится пропускать без модерирования только зарегистрированных юзеров, но и это не вполне помогает.
Мировая часть проблемы в Drupal решена - ко всем ссылкам в юзерском контенте можно добавлять rel=nofollow, отчего спамить под гугл становится неинтересно. Остается яндекс, который rel=nofollow не понимает (насколько мне известно), но зато понимает "рамблеровский" (придуманный Димой Крюковым) тег <noindex>.
Сооответственно, нужно добавить три строчки кода к modules/filter/filter.module:
В noscript,noindex, a.. rel=nofollow помещается слово [link] которое и становится ссылкой для Javascript-disabled people (стандартные стили у Drupal такие, что картинка переносится на новую строку и красивая стрелка не получается).
Стандартный дисклеймер. Если вы не знаете что такое патч, то вам все вышеописанное не нужно.
Ссылками в комментариях спамят не только этот блог, но и мои сайты на Drupal (libraw.org,gpgpu.ru и так далее). В отличие от MovableType, антиспам-средства у Drupal развиты еще меньше, приходится пропускать без модерирования только зарегистрированных юзеров, но и это не вполне помогает.
Мировая часть проблемы в Drupal решена - ко всем ссылкам в юзерском контенте можно добавлять rel=nofollow, отчего спамить под гугл становится неинтересно. Остается яндекс, который rel=nofollow не понимает (насколько мне известно), но зато понимает "рамблеровский" (придуманный Димой Крюковым) тег <noindex>.
Сооответственно, нужно добавить три строчки кода к modules/filter/filter.module:
В noscript,noindex, a.. rel=nofollow помещается слово [link] которое и становится ссылкой для Javascript-disabled people (стандартные стили у Drupal такие, что картинка переносится на новую строку и красивая стрелка не получается).
Стандартный дисклеймер. Если вы не знаете что такое патч, то вам все вышеописанное не нужно.
В статусной строке не отображается URL. Это тоже лечится яваскриптом, но уже лень т.к. просто присвоение windows.status= не работает в Firefox/Opera, нужно таймеры ставить.
Потерялось открытие ссылки в отдельном окне. Можно, наоборот, сделать через window.open, но тогда потеряется открытие в текущем. Счастья нет.
В этом блоге, впрочем, используется несколько другая версия патча, которая оставляет ссылки на мои сайты прямыми, а остальные открывает в новом окне. Не публикую т.к. не нашел разумного способа вытащить хотя бы URL текущего блога в том месте, где зовется nofollowfy();
Принято считать, что поисковая выдача на Mail.ru и поисковая выдача Яндекса - это одно и то же (с точностью до региональных настроек, которые разные). И последние года два это было так с какой-то точностью.
При этом трафик с go.mail.ru и с Яндекса был сильно скоррелирован. Аудитория, конечно, заметно отличается, поэтому по конкретным запросам отношение частот переходов не вполне соответствовали общерунетовскому среднему 1:6 (или около того, отношение довольно быстро меняется в сторону mail.ru), но выдача, насколько я ее смотрел, была одинаковой.
В последнюю неделю ситуация кардинально изменилась, на картинке среднесуточный трафик на блог:
Mail.ru стало давать в разы больше трафика, чем Яндекс, причем всего по нескольким запросам. Удивительнее всего то, что в мейловой выдаче отсутствует очевидный лидер по этому запросу (и это не мой блог :).
При проверке по другим запросам - выдача одинаковая по средне- и низкочастотникам, но по некоторым высокочастотникам - отличается. Mail редактирует поисковые результаты по избранным запросам?
Не секрет, что SEOшники массово снимают позиции подопечных сайтов в поисковой выдаче. Влияние этих роботов на частоты низкочастотных запросов достаточно очевидно: если позицию по запросу с "реальной частотой" 10 проверять каждый день, то частота станет 40.
Естественно, поисковые машины таких проверяльщиков видят. Народ ведь не знает меры, представители Яндекса говорили о сотнях тысяч запросов с одного IP за несколько часов/сутки.
В то же время, считается что на частоты средне- и особенно высокочастотников SEO-роботы влияют мало. Действительность же превосходит самые смелые ожидания.
В день 90-летия Великой Октябрьской Социалистической Революции октябрьский пересчет Google Pagerank был изучен, препарирован и исчислен, читайте и наслаждайтесь.
Никаких содержательных выводов, впрочем, не произведено, только анализ циферок в разных разрезах.
Как многие знают, Google пересчитал pagerank, причем преимущественно в минус :). Однако еще в середине недели цифирки колебались, анализировать что насчитали явно рано, надо еще какое-то время подождать.
На сегодняшний день, впрочем, в Рунете видно только три сайта с честным PR8: liveinternet.ru, ihep.ru и spbu.ru. Два очень старых, а один - очень цитируемый. Rambler из восьмерок выпал, а больше честных восьмерок и не было, либо зеркала перечисленных выше, либо зеркала зарубежных сайтов (включая и Томь-Усинский завод железобетонных конструкций, а ведь наверное кто-то за такой PR c них денег взял....).
На сегодня среди восьмерок есть еще 8 зеркал зарубежных сайтов: 4 зеркала skype.com и еще 4 одиночных зеркала зарубежных сайтов.
Да, стандартное наблюдение над тем, какие страницы/сайты получили PR:
страница http://blog.lexa.ru/2007/10/02/ - получила PR
страница http://blog.lexa.ru/2007/10/04/ - не получила
К MT3 был отдельный плагин nofollow, который приписывал атрибут rel=nofollow ко всем ссылкам в комментариях.
В четвертой версии эта функциональность есть прямо в самом движке. Ее несколько расширили, в частности в комментарях от доверенных комментаторов можно такую функциональность выключить (и тем их поощрить).
Естественно, о российских реалиях и теге <noindex> в SixApart не знают. Прилагаемый
решает эту проблему. На глаз - работает.
P.S. Если вы не знаете что такое "патч", то он вам не нужен
Берем запросы и раскладываем их по тематикам. Да, полноты не добиться, но больше половины - разложим. Получим оценку поискового трафика по данной теме.
Поделим ссылочные бюджеты на этот трафик - получим оценку стоимости привлечения пользователей из поисковиков.
Все это проделано в статье.
Выводы, как обычно, довольно любопытные:
Если смотреть по тематике, а не по конкретному запросу, то стоимость привлечения клиентов через SEO в разы и порядки дешевле, чем привлечение их же контекстной рекламой.
Естественно, самые дорогие клиенты - в узких тематиках. Мало запросов, высокая конкуренция и так далее.
Судя по всему, продвижением по низкочастотным запросам занимаются мало, по многим крупным и интересным тематикам (Автомобили, например) количество уникальных текстов ссылок на порядок меньше количества формулировок запросов. При том, что текст ссылки может быть уникальным за счет названия сайта-клиента.
Берем все морды, выделяем те, где ссылки что-то стоят (и этих ссылок не слишком много и не слишком мало). Стоимость каждой ссылки считаем по волшебной формуле.
Выкачиваем все страницы, на которые ведут эти ссылки.
Автоматически, с помощью секретной технологии Семантическое Зеркало, определяем тематики выкачаных страниц и тематики ведущих на них ссылок.
Распределяем цены ссылок по определившимся тематикам.
Сортируем по месячному бюджету, добавляем в суп сайты - лидеры тематик по бюджетам.
Получается достаточно любопытно. Скажем, я знал что на пластиковые окна тратятся тысячи в месяц, но семь килобаксов только на морды - это уже за гранью добра и зла.