В кулуарах Хайлоада представители Спайлога не стеснялись утверждать, что их тренды - репрезентативны, а глобальная статистика - хороша. Не хочется обижать хороших людей, но правда дороже.
Эти данные неплохо согласуются с полной статистикой LiveInternet, но вот данные о поисковых фразах заставляют задуматься о
репрезентативности всей конструкции.
Поковырял 10 минут детектор доменных паркингов на черном квадрате и все сломалось. Недавно отмечали миллион на квадрате, на прошлой неделе было еще чуть больше (1007012) "настоящих живых сайтов", а стало 928332.
Ну значит еще раз инфоповод будет, где-то осенью... Если, конечно, не выяснится, что паркингов еще больше.
Редкий случай, когда невозможно доказать, что у меня работает полный автомат.
Автоматическое обновление черного квадрата позавчера поздравило меня с приездом и выдало круглую цифру. Позволю себе скриншот:
Торопитесь увидеть, это продержится до следующей среды, а потом их станет еще больше.
На всякий случай: подсчет парковок у меня довольно условный и срабатывает только если запаркованых доменов на одном хостере реально много, не меньше нескольких тысяч.
Улучшил процедуру распознания доменных паркингов на черном квадрате.
Старая процедура распознавала около 45 тысяч запаркованых сайтов, новая - 172 тысячи. Отчего квадрат стал меньше, но за счет подавления дубликатов страниц - не таким раздражающим.
Копать еще есть куда, например явно нужно подавлять дефолтные странички от хостеров, сообщения что такой-то отключен за неуплату и так далее. Как дойдут руки - займусь, благо варез для подавления дублей - имеется.
С прискорбием вынужден сообщить, что в предыдущую публикацию вкралась ошибка: в колонке, где показано количество размещенных доменов у хостера, для компании Infobox ошибочно был указан номер автономной системы (30968) вместо количества доменов (26433).
Это не повлияло на позиции компаний в рейтинге, однако повлияло на
расчет темпов годового роста, вместо реального роста в 48% был показан неправильный (74%).
Ошибка исправлена, виновные наказаны, невиновные тоже наказаны. Автор выражает признательность техническому директору компании Infobox за сообщение о несуразности.
Рунет (количество сайтов в .RU/.SU) растет, все на те же 60-70 процентов в год. При этом зона .SU за год выросла впятеро (а с декабря - более чем втрое), вот что животворительное снижение цен делает.
На "рынке http-серверов" выросла доля Apache и IIS (потеснили nginx). Научные исследования показали, что это влияние служб паркинга доменов.
На рынке хостинга полный раздрай:
сайты побежали в Германию (и в меньшей степени в Штаты). Если год назад забугорным размещением пользовались около 100 тыс. сайтов, то в этом - уже около 250 тыс.
Среди лидеров хостинга прошлого года быстрее рынка рос только Infobox, остальные либо росли медленнее рынка, либо и вовсе, мягко скажем, не росли.
Перепечатка материала приветствуется (с указанием автора и ссылкой, конечно). Обсудить буду рад прямо тут, в комментариях.
Семьсот тысяч было в начале июля, темпы роста практически сохраняются: в марте-июне было 60% годовых, в июле-октябре 56%, но это ведь был мертвый летний сезон.
По моим прикидкам, в течение месяца должны достичь миллиона делегированных.
В обсуждении моей предыдущей
заметки о пятничных сайтах
родилась здравая мысль: посмотреть на статистику смены сайтами IP-адресов. Мне всегда
казалось, что смена адреса — крайне редкое явление, но интересно проверить так ли это.
Не углубляясь далеко в историю, я взял данные за последние 4 понедельника, с 24 сентября по 15 октября
включительно. На каждый из понедельников у меня есть:
данные по делегированию: имеется ли для данного домена nameserver (по мнению NS-ов для зон .RU/.SU);
данные по резолвингу WWW-сайтов: удалось ли получить из DNS запись для www.domain. или domain.
Из этого удается извлечь достаточно любопытные данные.
Я на эту тему уже писал, но готов утверждение усилить.
Каждый понедельник в 9 утра у меня стартует очередная выкачка для черного квадрата. К утру вторника оно резолвит и выкачивает все, что резолвится и выкачивается с первого раза. Последние месяца два - это процентов 80-85% от того, что показано на квадрате, где-то 650-680 тысяч сайтов отвечают с первого раза (цифры для последних трех недель).
После этого наблюдается весьма странная картина:
Во вторник-четверг пополнить квадрат толком не удается. Сайтов, которые не работали в понедельник, но починились к утру четверга - относительно немного. Ну скажем еще 40 тысяч за три дня удается окучить. Каждый новый проход находит 3-5% живых среди ранее неживых.
вечером четверга живых (среди ранее мертвых) куда больше, начиная с этого момента и до субботы каждый новый проход оживляет процентов 9-10.
Что это ? Десятки тысяч сайтов падают на выходных, их всю неделю чинят, к четвергу достигают успеха ?
Какой-либо статистики (по хостингу, по IP, по whois, по списку сайтов) я не делал, но руки уже чешутся.
Банально, но на черном квадрате уже более 700 тысяч точек. Т.е. 702 тысячи сайтов в .RU/SU взяли и ответили.
600 тысяч было в начале марта, 17 процентов за 4 месяца - это все те же 60 годовых.