Поковырял 10 минут детектор доменных паркингов на и все сломалось. Недавно отмечали миллион на квадрате, на прошлой неделе было еще чуть больше (1007012) "настоящих живых сайтов", а стало 928332.
Ну значит еще раз инфоповод будет, где-то осенью... Если, конечно, не выяснится, что паркингов еще больше.
Редкий случай, когда невозможно доказать, что у меня работает полный автомат.
Автоматическое обновление позавчера поздравило меня с приездом и выдало круглую цифру. Позволю себе скриншот:
Торопитесь увидеть, это продержится до следующей среды, а потом их станет еще больше.
На всякий случай: подсчет парковок у меня довольно условный и срабатывает только если запаркованых доменов на одном хостере реально много, не меньше нескольких тысяч.
Улучшил процедуру распознания доменных паркингов на .
Старая процедура распознавала около 45 тысяч запаркованых сайтов, новая - 172 тысячи. Отчего квадрат стал меньше, но за счет подавления дубликатов страниц - не таким раздражающим.
Копать еще есть куда, например явно нужно подавлять дефолтные странички от хостеров, сообщения что такой-то отключен за неуплату и так далее. Как дойдут руки - займусь, благо варез для подавления дублей - имеется.
С прискорбием вынужден сообщить, что в вкралась ошибка: в колонке, где показано количество размещенных доменов у хостера, для компании Infobox ошибочно был указан номер автономной системы (30968) вместо количества доменов (26433).
Это не повлияло на позиции компаний в рейтинге, однако повлияло на
расчет темпов годового роста, вместо реального роста в 48% был показан неправильный (74%).
Ошибка исправлена, виновные наказаны, невиновные тоже наказаны. Автор выражает признательность техническому директору компании за сообщение о несуразности.
Анонсирую очередную нетленку: .
Из интересных наблюдений:
Рунет (количество сайтов в .RU/.SU) растет, все на те же 60-70 процентов в год. При этом зона .SU за год выросла впятеро (а с декабря - более чем втрое), вот что животворительное снижение цен делает.
На "рынке http-серверов" выросла доля Apache и IIS (потеснили nginx). Научные исследования показали, что это влияние служб паркинга доменов.
На рынке хостинга полный раздрай:
сайты побежали в Германию (и в меньшей степени в Штаты). Если год назад забугорным размещением пользовались около 100 тыс. сайтов, то в этом - уже около 250 тыс.
Среди лидеров хостинга прошлого года быстрее рынка рос только Infobox, остальные либо росли медленнее рынка, либо и вовсе, мягко скажем, не росли.
Перепечатка материала приветствуется (с указанием автора и ссылкой, конечно). Обсудить буду рад прямо тут, в комментариях.
Очередной раз надругался над данными . Для 800 с гаком тысяч сайтов выкачаны дополнительные страницы и определены:
охват основных систем контекстной рекламы (Google, Begun, Yandex) по сайтам;
рыночные доли тех же систем по показам рекламных блоков.
Надо сказать, что результаты довольно неожиданные для меня, сделал я все это неделю назад, к конференции, но публиковать не стал, ибо результаты противоречили моим представлениям о жизни. Впрочем, после доклада Ломизе, где были очень похожие цифры, представления о жизни вернулись на место.
Через месяц после случилась и очередная круглая цифра в : взяли рубеж в 800 живых килосайтов.
Семьсот тысяч было в начале июля, темпы роста практически сохраняются: в марте-июне было 60% годовых, в июле-октябре 56%, но это ведь был мертвый летний сезон.
По моим прикидкам, в течение месяца должны достичь миллиона делегированных.
В моей предыдущей
заметки о пятничных сайтах
родилась здравая мысль: посмотреть на статистику смены сайтами IP-адресов. Мне всегда
казалось, что смена адреса — крайне редкое явление, но интересно проверить так ли это.
Не углубляясь далеко в историю, я взял данные за последние 4 понедельника, с 24 сентября по 15 октября
включительно. На каждый из понедельников у меня есть:
данные по делегированию: имеется ли для данного домена nameserver (по мнению NS-ов для зон .RU/.SU);
данные по резолвингу WWW-сайтов: удалось ли получить из DNS запись для www.domain. или domain.
Из этого удается извлечь достаточно любопытные данные.
Я на эту тему уже писал, но готов утверждение усилить.
Каждый понедельник в 9 утра у меня стартует очередная выкачка для . К утру вторника оно резолвит и выкачивает все, что резолвится и выкачивается с первого раза. Последние месяца два - это процентов 80-85% от того, что показано на квадрате, где-то 650-680 тысяч сайтов отвечают с первого раза (цифры для последних трех недель).
После этого наблюдается весьма странная картина:
Во вторник-четверг пополнить квадрат толком не удается. Сайтов, которые не работали в понедельник, но починились к утру четверга - относительно немного. Ну скажем еще 40 тысяч за три дня удается окучить. Каждый новый проход находит 3-5% живых среди ранее неживых.
вечером четверга живых (среди ранее мертвых) куда больше, начиная с этого момента и до субботы каждый новый проход оживляет процентов 9-10.
Что это ? Десятки тысяч сайтов падают на выходных, их всю неделю чинят, к четвергу достигают успеха ?
Какой-либо статистики (по хостингу, по IP, по whois, по списку сайтов) я не делал, но руки уже чешутся.
Банально, но на уже более 700 тысяч точек. Т.е. 702 тысячи сайтов в .RU/SU взяли и ответили.
600 тысяч было в начале марта, 17 процентов за 4 месяца - это все те же 60 годовых.
Берем запросы и раскладываем их по тематикам. Да, полноты не добиться, но больше половины - разложим. Получим оценку поискового трафика по данной теме.
Поделим ссылочные бюджеты на этот трафик - получим оценку стоимости привлечения пользователей из поисковиков.
Все это проделано в статье.
Выводы, как обычно, довольно любопытные:
Если смотреть по тематике, а не по конкретному запросу, то стоимость привлечения клиентов через SEO в разы и порядки дешевле, чем привлечение их же контекстной рекламой.
Естественно, самые дорогие клиенты - в узких тематиках. Мало запросов, высокая конкуренция и так далее.
Судя по всему, продвижением по низкочастотным запросам занимаются мало, по многим крупным и интересным тематикам (Автомобили, например) количество уникальных текстов ссылок на порядок меньше количества формулировок запросов. При том, что текст ссылки может быть уникальным за счет названия сайта-клиента.
Продолжаем палить SEO-темы:
.
Если в двух словах, то все просто:
Берем все морды, выделяем те, где ссылки что-то стоят (и этих ссылок не слишком много и не слишком мало). Стоимость каждой ссылки считаем по волшебной формуле.
Выкачиваем все страницы, на которые ведут эти ссылки.
Автоматически, с помощью секретной технологии Семантическое Зеркало, определяем тематики выкачаных страниц и тематики ведущих на них ссылок.
Распределяем цены ссылок по определившимся тематикам.
Сортируем по месячному бюджету, добавляем в суп сайты - лидеры тематик по бюджетам.
Получается достаточно любопытно. Скажем, я знал что на пластиковые окна тратятся тысячи в месяц, но семь килобаксов только на морды - это уже за гранью добра и зла.
По результатам сбора данных для очередного выпуска , живых сайтов в рунете* уже более 600 тысяч**.
Полмиллиона отмечали в ноябре, значит за 4 месяца рост на 20% (т.е. более 70% годовых). Но если посмотреть , то увидим реальный рост примерно на 60% (точно будет известно через неделю). Откуда следует, что в последние месяцы рост ускорился.
*как и всегда в черном квадрате, когда я пишу в рунете я имею в виду длинную формулировку сайты domain.tld или www.domain.tld, где domain.tld — домен 2-го уровня в .RU и .SU.
**на самом деле, в понедельник наскребется еще несколько тысяч, в выходные лежит обычно пара процентов сайтов.
Upd: Как и обещал, к вечеру понедельника их стало 605 тысяч. Ну не несколько процентов, а полпроцента. Но несколько тысяч.