SEO

Грозным видом соблазнят гвозди марки "150"

С сайта ООО "Реальные гвозди"

 

Для любовниц и подруг,
Гвозди "200" - лучший друг...
Можно в голову забить,
Чтоб извилины развить.

...

Гвозди марки "50"
Вас собою удивят.
Этот сорт среди гвоздей,
Для коробок и дверей.

...

Гвоздь "180" хорош
Рыбу он бросает в дрожь.
....

И так далее, про 26 размеров гвоздей.

И подумалось мне, что свои ЕСТЕСТВЕННЫЕ ССЫЛКИ, которых сейчас на них понаставят, эти ребята честно заработали.

Бешеные SEO-роботы

Не секрет, что SEOшники массово снимают позиции подопечных сайтов в поисковой выдаче. Влияние этих роботов на частоты низкочастотных запросов достаточно очевидно: если позицию по запросу с "реальной частотой" 10 проверять каждый день, то частота станет 40.

Естественно, поисковые машины таких проверяльщиков видят. Народ ведь не знает меры, представители Яндекса говорили о сотнях тысяч запросов с одного IP за несколько часов/сутки.

В то же время, считается что на частоты средне- и особенно высокочастотников SEO-роботы влияют мало. Действительность же превосходит самые смелые ожидания.

О пользе опечаток: одноклассники или однокласники ?

За последние десять дней у меня вдруг резко вырос поисковый трафик с Гугла. Более того, в товарных количествах появился трафик с Live.com/MSN:
odnoklassniki-2.png

Я, естественно, удивился и начал смотреть внимательнее.

Партнерские системы контекстной рекламы

Очередной раз надругался над данными Черного квадрата. Для 800 с гаком тысяч сайтов выкачаны дополнительные страницы и определены:
  • охват основных систем контекстной рекламы (Google, Begun, Yandex) по сайтам;
  • рыночные доли тех же систем по показам рекламных блоков.

Надо сказать, что результаты довольно неожиданные для меня, сделал я все это неделю назад, к конференции, но публиковать не стал, ибо результаты противоречили моим представлениям о жизни. Впрочем, после доклада Ломизе, где были очень похожие цифры, представления о жизни вернулись на место.

А, да, чуть не забыл. Ссылка на текст: Партнерские сети систем контекстной рекламы (октябрь 2007).

Однокласники, вконтакте

А ведь однокласники.ру - первые в Top100, если смотреть за неделю и по показам страниц. По охвату - скорее вторые (все мы помним, как Top100 считает охват).

В основном рейтинге Топ-100 нет собственно Рамблера, но он по показам будет третьим, а по охвату - вторым (по Top.Mail то же самое).

В-общем, граждане интернет-холдинги, хихикали летом на статистику Вконтакте по Alexa, хихикали, а зря хихикали. Они сейчас еще монетизируются и опаньки.

Пересчет Google PageRank в октябре 2007 года

В день 90-летия Великой Октябрьской Социалистической Революции октябрьский пересчет Google Pagerank был изучен, препарирован и исчислен, читайте и наслаждайтесь.

Никаких содержательных выводов, впрочем, не произведено, только анализ циферок в разных разрезах.

Пересчет Google PageRank: пыль еще не улеглась

Как многие знают, Google пересчитал pagerank, причем преимущественно в минус :). Однако еще в середине недели цифирки колебались, анализировать что насчитали явно рано, надо еще какое-то время подождать.

На сегодняшний день, впрочем, в Рунете видно только три сайта с честным PR8: liveinternet.ru, ihep.ru и spbu.ru. Два очень старых, а один - очень цитируемый. Rambler из восьмерок выпал, а больше честных восьмерок и не было, либо зеркала перечисленных выше, либо зеркала зарубежных сайтов (включая и Томь-Усинский завод железобетонных конструкций, а ведь наверное кто-то за такой PR c них денег взял....).

На сегодня среди восьмерок есть еще 8 зеркал зарубежных сайтов: 4 зеркала skype.com и еще 4 одиночных зеркала зарубежных сайтов.

Да, стандартное наблюдение над тем, какие страницы/сайты получили PR:

  • страница http://blog.lexa.ru/2007/10/02/ - получила PR
  • страница http://blog.lexa.ru/2007/10/04/ - не получила
Таким образом, для пересчета взяты данные за 2-3 октября. Примерно такая же ситуация была весной: 28 апреля начали публиковать данные с датой отсечки около 3-го апреля.

Коммерсант о SEO

В сегодняшнем бумажном Коммерсанте статья про SEO. Точнее, конечно, про linkbombing в Яндексе, упоминаются так любимые сообществом гавно и отстой (ссылок не даю, Яндекс сегодня все поправил).

Больше всего жгут цитаты (вырываю из контекста):

"Яндекс" решить эту проблему не в состоянии.
В "Яндексе" об этом знают, но эффективных средств борьбы пока не видят.
И остается только ждать, пока Ларри Пейдж придумает более эффективный "движок"

Кто следил за темой, Яндекс поправил выдачу вчера (или раньше) или уже после выхода публикации ? Или нашли эффективные средства борьбы ?

UPD: прямая ссылка, спасибо motto в ЖЖ и Юрию Аксенову в Я.ру

Черный квадрат: DNS-статистика

В обсуждении моей предыдущей заметки о пятничных сайтах родилась здравая мысль: посмотреть на статистику смены сайтами IP-адресов. Мне всегда казалось, что смена адреса — крайне редкое явление, но интересно проверить так ли это.

Не углубляясь далеко в историю, я взял данные за последние 4 понедельника, с 24 сентября по 15 октября включительно. На каждый из понедельников у меня есть:

  • данные по делегированию: имеется ли для данного домена nameserver (по мнению NS-ов для зон .RU/.SU);
  • данные по резолвингу WWW-сайтов: удалось ли получить из DNS запись для www.domain. или domain.

Из этого удается извлечь достаточно любопытные данные.

Пятничные сайты

Я на эту тему уже писал, но готов утверждение усилить.

Каждый понедельник в 9 утра у меня стартует очередная выкачка для черного квадрата. К утру вторника оно резолвит и выкачивает все, что резолвится и выкачивается с первого раза. Последние месяца два - это процентов 80-85% от того, что показано на квадрате, где-то 650-680 тысяч сайтов отвечают с первого раза (цифры для последних трех недель).

После этого наблюдается весьма странная картина:

  • Во вторник-четверг пополнить квадрат толком не удается. Сайтов, которые не работали в понедельник, но починились к утру четверга - относительно немного. Ну скажем еще 40 тысяч за три дня удается окучить. Каждый новый проход находит 3-5% живых среди ранее неживых.
  • вечером четверга живых (среди ранее мертвых) куда больше, начиная с этого момента и до субботы каждый новый проход оживляет процентов 9-10.

Что это ? Десятки тысяч сайтов падают на выходных, их всю неделю чинят, к четвергу достигают успеха ?

Какой-либо статистики (по хостингу, по IP, по whois, по списку сайтов) я не делал, но руки уже чешутся.

Movable Type 4: nofollow и noindex

К MT3 был отдельный плагин nofollow, который приписывал атрибут rel=nofollow ко всем ссылкам в комментариях.

В четвертой версии эта функциональность есть прямо в самом движке. Ее несколько расширили, в частности в комментарях от доверенных комментаторов можно такую функциональность выключить (и тем их поощрить).

Естественно, о российских реалиях и теге <noindex> в SixApart не знают. Прилагаемый

патч
решает эту проблему. На глаз - работает.

P.S. Если вы не знаете что такое "патч", то он вам не нужен

Банальное: рунет растет

Банально, но на черном квадрате уже более 700 тысяч точек. Т.е. 702 тысячи сайтов в .RU/SU взяли и ответили. 600 тысяч было в начале марта, 17 процентов за 4 месяца - это все те же 60 годовых.

Ссылочное ранжирование в Рунете, часть 4: трафик по тематикам

Очередная статья на тему SEO: Ссылочное ранжирование в Рунете, часть 4: тематический трафик.
Допустим, у нас есть данные о частотах запросов (а они есть), тогда по ним можно посчитать очень интересное.
  • Берем запросы и раскладываем их по тематикам. Да, полноты не добиться, но больше половины - разложим. Получим оценку поискового трафика по данной теме.
  • Поделим ссылочные бюджеты на этот трафик - получим оценку стоимости привлечения пользователей из поисковиков.

Все это проделано в статье.

Выводы, как обычно, довольно любопытные:

  • Если смотреть по тематике, а не по конкретному запросу, то стоимость привлечения клиентов через SEO в разы и порядки дешевле, чем привлечение их же контекстной рекламой.
  • Естественно, самые дорогие клиенты - в узких тематиках. Мало запросов, высокая конкуренция и так далее.
  • Судя по всему, продвижением по низкочастотным запросам занимаются мало, по многим крупным и интересным тематикам (Автомобили, например) количество уникальных текстов ссылок на порядок меньше количества формулировок запросов. При том, что текст ссылки может быть уникальным за счет названия сайта-клиента.

Зачитать текст

Тематические бюджеты: изменения и дополнения

Достаточно плодотворная дискуссия в ru_seo, плюс множество персональных обсуждений убедили меня в том, что статья про ссылочные бюджеты по тематикам нуждается в некоторой доработке.

Что и было сделано. Встречайте Ссылочное ранжирование в Рунете, часть 3b: тематические бюджеты с изменениями и дополнениями.

Изменения и дополнения:

  • Не учитываем ссылки с "мегапорталов" - сайтов с формальной ценой ссылки более $500
  • Помимо топовых бюджетов считается среднее для Top-10 бюджетов

Напоминаю, что относиться к этим данным следует весьма осторожно:

  • многие сайты продвигаются по многим темам сразу;
  • многие сайты продвигаются не только мордами;
  • большой бюджет на ссылки не гарантирует успеха в продвижении.

Ссылочное ранжирование в Рунете, часть 3: тематические бюджеты

Продолжаем палить SEO-темы: Ссылочное ранжирование в Рунете III: бюджеты по тематикам. Если в двух словах, то все просто:
  • Берем все морды, выделяем те, где ссылки что-то стоят (и этих ссылок не слишком много и не слишком мало). Стоимость каждой ссылки считаем по волшебной формуле.
  • Выкачиваем все страницы, на которые ведут эти ссылки.
  • Автоматически, с помощью секретной технологии Семантическое Зеркало, определяем тематики выкачаных страниц и тематики ведущих на них ссылок.
  • Распределяем цены ссылок по определившимся тематикам.
  • Сортируем по месячному бюджету, добавляем в суп сайты - лидеры тематик по бюджетам.

Подробности читать тут.

Получается достаточно любопытно. Скажем, я знал что на пластиковые окна тратятся тысячи в месяц, но семь килобаксов только на морды - это уже за гранью добра и зла.

Новый PageRank

Google начал публикацию новых значений toolbar Pagerank.

Несложная прикидка показала, что rank получили страницы, проиндексированные 2-3-го апреля и ранее. Более новые страницы - не получили. Вот например:

  • http://www.lexa.ru/nginx-ru/msg10113.html - 3 апреля, 00:59 - не получила PR
  • http://www.lexa.ru/nginx-ru/msg10112.html - 3 апреля, 00:28, PR3

Сильно оперативнее, чем в в прошлый раз, когда в начале января были учтены страницы за 12-13 ноября.

Ссылочное ранжирование в Рунете II: тексты ссылок, реципиенты ссылок

Продолжаю упражнения со ссылочной базой с "морд" сайтов рунета:
Ссылочное ранжирование в Рунете: реципиенты ссылок, тексты ссылок.

Рассмотрены:

  • получатели (реципиенты) ссылок с главных страниц;
  • наиболее частые тексты ссылок;
  • наиболее частые слова в текстах ссылок;
  • какие бюджеты тратятся на "морды"
  • какие тематики наиболее конкурентные
Обсуждать можно в коментах к этой записи.

О левом уклоне

Обработал данные о кликах в черный квадрат за прошедший год (более 220 тысяч кликов).

Получается любопытно:

  • ну, что кликают в углы - это и так было известно. Но что туда плохо попадают....:)
  • интереснее, на мой вкус, довольно сильная смещенность влево: почти 55% кликов идет в левую половину квадрата

О среднем downtime рунета

Лемма: в любой, произвольно выбранный, момент времени 1-2% сайтов Рунета не отвечают на запросы. То же относится и к серверам DNS.

Следствие: даже со скриптами бесконечной скорости, нельзя провести очередной сбор данных черного квадрата за один день. Чтобы собрать все нужно начать в понедельник и повторять ежедневно до пятницы. При этом, 98% будет собрано в понедельник.

Рунет в марте 2007 года

Выпустил в свет статью Рунет в марте 2007 года: домены, хостинг, география сайтов.

Написано полностью в формате предыдущего выпуска годовалой давности, поэтому цифирки можно сравнивать (что и сделано).

Краткие выводы:

  • никаких резких движений не произошло
  • сайты все больше перемещаются на хостинги с in-house
Из интересных фактов:
  • 22.7% Web-серверов - nginx
  • Мастерхост за год нарастил клиентскую базу почти втрое (остальные лидеры росли в лучшем случае чуть-чуть быстрее рынка)

Pages

Subscribe to SEO