статистика

О боевой революционной социологии

Я не люблю писать о политике, 10G ethernet или цифровое фото - гораздо интереснее.

Но тут, волею судеб, довелось 10 минут поанализировать данные правильного, настоящего опроса населения (попросили, я и посмотрел), не пропадать же добру.

В интернете (и, в частности, соцсетях) последние дни активно пиарится общественный опрос общественного же мнения (в соцсетях преимущественно ссылаются на сайт эха, сошлюсь и я). Согласно этим данным, рейтинг Путина сильно преувеличен, "Шансы Путина на победу в первом туре равны нулю", и так далее.

По счастью, это тот же самый опрос, "Гражданина Социолога", для которого доступны первичные данные по ряду городов. Список городов совпадает, количество респондентов совпадает, все совпадает.

Давайте посмотрим на них повнимательнее.

Прощание с полимерами?

Просрали все полимеры!

Когда я работал в одном маленьком сумасш интернет-холдинге начальником Top100, меня очень интересовал вопрос: а что будет, если ужасный плоский рубрикатор Топ100 (из 50+ рубрик первого уровня) заменить на правильный иерархический?

Тогда у меня не хватило смелости принять это решение. Нет, если бы начальство велело, то я бы с превеликим удовольствием, но начальству было не до этого, а у меня не хватило силы воли, да и пользователи привыкли.

Прошло 8.5 лет и новое руководство Top100 таки решилось.

Верните как было!

liru-14may.png

А это у нас 3/4 интернета куда-то подевалось или li.ru данные за сегодня проэтосамое?

P.S. Срез "все сайты"

Upd: да, за сегодня, с 00 по 11 часов. http://www.liveinternet.ru/stat/lexa-ru/hours.html

Ну, за репрезентативность

В кулуарах Хайлоада представители Спайлога не стеснялись утверждать, что их тренды - репрезентативны, а глобальная статистика - хороша. Не хочется обижать хороших людей, но правда дороже.

Вот как выглядит верхушка топа поисковиков за октябрь по версии Spylog Тренды:

spylog-search.png

Эти данные неплохо согласуются с полной статистикой LiveInternet, но вот данные о поисковых фразах заставляют задуматься о репрезентативности всей конструкции.

Доверяй, но проверяй

liru-mail.png LiveInternet выкатил статистику по переходам из почтовых систем, которая удивила как минимум в двух местах:

  • Во-первых, доля Яндекса оказалась заниженной. Выяснилось, что в ряде случаев резался реферер, что в Яндекс.Почте быстро поправили.
  • Во-вторых, доля Гугл-почты оказалась просто неприлично низкой, меньше процента.

Впрочем, несложный эксперимент показал, что gmail.com тоже режет рефереры. Посылаем сами себе письмо со ссылкой на собственный сайт (логи которого доступны), жмем на нее и видим в логах:

91.78.182.177 - - [29/Oct/2008:12:50:09 +0300] "GET /2008/10/post.html HTTP/1.1"
 200 32630 "-" "Mozilla/4.0 (compatible; MSIE 7.0;...."
Другими словами, о доле Gmail по этой статистике судить никак нельзя. Раз в логах нет, значит и Javascript-счетчик реферера не увидит.

Чтобы два раза не вставать, пну еще и гиганта. Письмо с сабжектом "вот ссылка" и текстом из этой ссылки и подписи gmail.com положил в папку Spam.

Subscribe to статистика