В кулуарах Хайлоада представители Спайлога не стеснялись утверждать, что их тренды - репрезентативны, а глобальная статистика - хороша. Не хочется обижать хороших людей, но правда дороже.
Вот как выглядит :
Эти данные неплохо согласуются с , но вот данные о поисковых фразах заставляют задуматься о
репрезентативности всей конструкции.
Поковырял 10 минут детектор доменных паркингов на и все сломалось. Недавно отмечали миллион на квадрате, на прошлой неделе было еще чуть больше (1007012) "настоящих живых сайтов", а стало 928332.
Ну значит еще раз инфоповод будет, где-то осенью... Если, конечно, не выяснится, что паркингов еще больше.
Редкий случай, когда невозможно доказать, что у меня работает полный автомат.
Автоматическое обновление позавчера поздравило меня с приездом и выдало круглую цифру. Позволю себе скриншот:
Торопитесь увидеть, это продержится до следующей среды, а потом их станет еще больше.
На всякий случай: подсчет парковок у меня довольно условный и срабатывает только если запаркованых доменов на одном хостере реально много, не меньше нескольких тысяч.
Улучшил процедуру распознания доменных паркингов на .
Старая процедура распознавала около 45 тысяч запаркованых сайтов, новая - 172 тысячи. Отчего квадрат стал меньше, но за счет подавления дубликатов страниц - не таким раздражающим.
Копать еще есть куда, например явно нужно подавлять дефолтные странички от хостеров, сообщения что такой-то отключен за неуплату и так далее. Как дойдут руки - займусь, благо варез для подавления дублей - имеется.
С прискорбием вынужден сообщить, что в вкралась ошибка: в колонке, где показано количество размещенных доменов у хостера, для компании Infobox ошибочно был указан номер автономной системы (30968) вместо количества доменов (26433).
Это не повлияло на позиции компаний в рейтинге, однако повлияло на
расчет темпов годового роста, вместо реального роста в 48% был показан неправильный (74%).
Ошибка исправлена, виновные наказаны, невиновные тоже наказаны. Автор выражает признательность техническому директору компании за сообщение о несуразности.
Анонсирую очередную нетленку: .
Из интересных наблюдений:
Рунет (количество сайтов в .RU/.SU) растет, все на те же 60-70 процентов в год. При этом зона .SU за год выросла впятеро (а с декабря - более чем втрое), вот что животворительное снижение цен делает.
На "рынке http-серверов" выросла доля Apache и IIS (потеснили nginx). Научные исследования показали, что это влияние служб паркинга доменов.
На рынке хостинга полный раздрай:
сайты побежали в Германию (и в меньшей степени в Штаты). Если год назад забугорным размещением пользовались около 100 тыс. сайтов, то в этом - уже около 250 тыс.
Среди лидеров хостинга прошлого года быстрее рынка рос только Infobox, остальные либо росли медленнее рынка, либо и вовсе, мягко скажем, не росли.
Перепечатка материала приветствуется (с указанием автора и ссылкой, конечно). Обсудить буду рад прямо тут, в комментариях.
Через месяц после случилась и очередная круглая цифра в : взяли рубеж в 800 живых килосайтов.
Семьсот тысяч было в начале июля, темпы роста практически сохраняются: в марте-июне было 60% годовых, в июле-октябре 56%, но это ведь был мертвый летний сезон.
По моим прикидкам, в течение месяца должны достичь миллиона делегированных.
В моей предыдущей
заметки о пятничных сайтах
родилась здравая мысль: посмотреть на статистику смены сайтами IP-адресов. Мне всегда
казалось, что смена адреса — крайне редкое явление, но интересно проверить так ли это.
Не углубляясь далеко в историю, я взял данные за последние 4 понедельника, с 24 сентября по 15 октября
включительно. На каждый из понедельников у меня есть:
данные по делегированию: имеется ли для данного домена nameserver (по мнению NS-ов для зон .RU/.SU);
данные по резолвингу WWW-сайтов: удалось ли получить из DNS запись для www.domain. или domain.
Из этого удается извлечь достаточно любопытные данные.
Я на эту тему уже писал, но готов утверждение усилить.
Каждый понедельник в 9 утра у меня стартует очередная выкачка для . К утру вторника оно резолвит и выкачивает все, что резолвится и выкачивается с первого раза. Последние месяца два - это процентов 80-85% от того, что показано на квадрате, где-то 650-680 тысяч сайтов отвечают с первого раза (цифры для последних трех недель).
После этого наблюдается весьма странная картина:
Во вторник-четверг пополнить квадрат толком не удается. Сайтов, которые не работали в понедельник, но починились к утру четверга - относительно немного. Ну скажем еще 40 тысяч за три дня удается окучить. Каждый новый проход находит 3-5% живых среди ранее неживых.
вечером четверга живых (среди ранее мертвых) куда больше, начиная с этого момента и до субботы каждый новый проход оживляет процентов 9-10.
Что это ? Десятки тысяч сайтов падают на выходных, их всю неделю чинят, к четвергу достигают успеха ?
Какой-либо статистики (по хостингу, по IP, по whois, по списку сайтов) я не делал, но руки уже чешутся.
Банально, но на уже более 700 тысяч точек. Т.е. 702 тысячи сайтов в .RU/SU взяли и ответили.
600 тысяч было в начале марта, 17 процентов за 4 месяца - это все те же 60 годовых.