Партнерские системы контекстной рекламы

Очередной раз надругался над данными Черного квадрата. Для 800 с гаком тысяч сайтов выкачаны дополнительные страницы и определены:
  • охват основных систем контекстной рекламы (Google, Begun, Yandex) по сайтам;
  • рыночные доли тех же систем по показам рекламных блоков.

Надо сказать, что результаты довольно неожиданные для меня, сделал я все это неделю назад, к конференции, но публиковать не стал, ибо результаты противоречили моим представлениям о жизни. Впрочем, после доклада Ломизе, где были очень похожие цифры, представления о жизни вернулись на место.

А, да, чуть не забыл. Ссылка на текст: Партнерские сети систем контекстной рекламы (октябрь 2007).

Comments

А есть статистика по тому, сколько страниц потребовалось скачать чтобы обнаружить рекламу?

А там же написано все. С каждого сайта я пытался взять три страницы (голову, одну страницу 2-го уровня, одну страницу 3-го). Не все сайты столько смогли отдать :)

Рискну предположить, что средняя посещаемость у сайтов, использующих Рамблер, выше, чем у сайтов, на которых счетчика Рамблера нет

И тогда доля Яндекса по контекстному трафику окажется еще выше

Было бы интересно посмотреть статистику по счетчику ЛИ.ру - на посещаемых сайтах он встречается реже Рамблера, но на малопосещаемых сайтах встречается видимо чаще (тем более что он нужен для анализа статистики, а не для трафикогенерации и не для предъявления рекламодателям)

Я не понимаю, как массово (сотни тысяч штук) взять данные из LI

И OCR-ить ? В-принципе, можно конечно. Хотя немножко геморойно.

Получается вы выкачили 15 теробайт данных ?

800000 сайтов * 20000 байт (примерный объем страницы) = 15 с гаком ккк байт

Гигабайт. Примерно 15 и есть.

Интересное исследование. Вот здесь не понял: "286 млн за неделю, всего таких сайтов 13500 (т.е. средняя посещаемость сайта с контекстной рекламой составляет 21 тысячу просмотров страниц в сутки, что в 1.5 раза выше"

Наверное, опечатка? 21000 просмотров страниц в неделю, или тогда в 15 раз?

286000000/13500 = 21185 - это по сайтам с контекстом
2188000000/148000 = 14783 - это по всем сайтам, попавшим в исследование.

Полтора раза.

Так это за неделю или за сутки? Написано-то "286 млн за неделю", а дальше "21 тысячу просмотров страниц в сутки". Исправьте в тексте.

О. Да, вы правы. Пошел исправлять

Интересные какие данные будут к следующей конференции - я как бы намекаю на изменения после новых правил яндекса, согласно которым на странице может быть до 9 рекламных модулей. Поживем - увидим =)