Как многие знают, если вы залогинены в ЖЖ, то вы залогинены и в kommersant.ru
Я согласия на такое не давал, впрочем меня и не спросили.
ЖЖ-шный саппорт пишет, что это счастье - для всех, а не только для "кириллического сегмента", проверять нет сил.
С коммерсантом (и, по всей видимости, всеми российскими партнерами) проблема решилась просто - если заблокировать куки на account.livejournal.ru, то наступает счастье - вместо автологина красивое крутящееся колесико и все.
Лемма: в любой, произвольно выбранный, момент времени 1-2% сайтов Рунета не отвечают на запросы. То же относится и к серверам DNS.
Следствие: даже со скриптами бесконечной скорости, нельзя провести очередной сбор данных черного квадрата за один день. Чтобы собрать все нужно начать в понедельник и повторять ежедневно до пятницы. При этом, 98% будет собрано в понедельник.
Получается, что 36% всех просмотров страниц - это переходы с поисковиков. Что-то много.
Считать сессии наверное неправильно: насколько я понимаю логику LiveInternet, сессией внутри раздела считается переходы между сайтами раздела. Другими словами, для сайта "все сайты" сессией будет вообще пользовательская сессия в интернете.
Понятно, что общая статистика - смещенная: там нет самых крупных сайтов Рунета (самих поисковиков, mail.ru), для ряда сайтов LiveInternet дает довольно странные цифры общей посещаемости (например, для rabota.ru: среднесуточная посещаемость по Рамблеру за февраль 620 тысяч просмотров страниц, а по LiveInternet втрое выше).
Вопрос к сообществу: верна ли оценка. А если неверна, то что я упустил ?
По результатам сбора данных для очередного выпуска черного квадрата, живых сайтов в рунете* уже более 600 тысяч**.
Полмиллиона отмечали в ноябре, значит за 4 месяца рост на 20% (т.е. более 70% годовых). Но если посмотреть на данные прошлого марта, то увидим реальный рост примерно на 60% (точно будет известно через неделю). Откуда следует, что в последние месяцы рост ускорился.
*как и всегда в черном квадрате, когда я пишу в рунете я имею в виду длинную формулировку сайты domain.tld или www.domain.tld, где domain.tld — домен 2-го уровня в .RU и .SU.
**на самом деле, в понедельник наскребется еще несколько тысяч, в выходные лежит обычно пара процентов сайтов.
Upd: Как и обещал, к вечеру понедельника их стало 605 тысяч. Ну не несколько процентов, а полпроцента. Но несколько тысяч.
Яндекс (в лице Яндекс.Ленты) профукивал пароли пользователей ЖЖ. С целью экономии трафика, вестимо.
Количество разума в мире постоянно, а население растет.
Update 1:
Судя по всему, через Яндекс-ленты была доступна часть подзамочных записей
В настоящий момент импорт не работает (error 404), а значит это не свежевнесенная бага,
а бывшая там давно
Если я правильно понимаю, чинить можно только путем размножения лент. Т.е. сделав "честный" агрегатор, который авторизованые RSS-ы будет хранить персонально для юзера.
Примерно к 2001 году вопрос с кодировками для русскоязычных WWW-сайтов казался полностью решенным: все сколько-нибудь распространенные браузеры научились кодировке Windows-1251 и только ее можно было оставить на сайтах (выдавая правильный Content-Type)
Но жизнь на месте не стоит и появилась новая беда: UTF-8. Никаких проблем с самой кодировкой нет - все поддерживают, работать несложно, можно писать многоязыковые документы.
Сейчас расцветает динамика, которую рисуют разными видами яваскрипта
Рассматривая результаты нового пересчета pagerank (не закончилось) - для каких страниц оно произошло, а для каких - нет, удалось довольно точно определить дату, на которую заморожено состояние интернета для пересчета.
Многим, вероятно, удобнее читать мои упражнения через френдленту ЖЖ. Следовательно, нужен кросспост туда. Коллективный разум предлагает два решения:
ljcrosspost — сделан неудобно, предполагает публикацию через выполнение тега, что означает перепубликацию при любой перевыкатке отдельных статей. Не понравилось.
MTLJpost сделан более человечно, публикация происходит при нажатии кнопки Save в редакторе т.е. вместе с trackback pings, нотификациями блог-поисков и еще один RPC call погоды не сделает.
Берем и ставим второй. Выясняется:
Машинка глючит, если нет картинки (юзерпика), соответствующего категории. Но править это соответствие после каждого редактирования категорий - мучительно.
Не хватает пары мелочей:
постинга тегов в ЖЖ
запрещения комментариев (с комментариями хочется всех загнать к себе)
Меняя, в очередной раз, много темплейтов MT, задумался об более человечной их структуре.
Я уже писал, что темплейты MT расчитаны скорее на секретаршу, чем на программистов продвинутых пользователей. В то же время, позиционируется MT на продвинутый рынок.
Даже возможность прицепить к блогу весь набор темплейтов одним движением руки уже сильно бы полечила, появились бы генераторы темплейтов на препроцессоре и т.п.
На мой вкус, человеческая темплейтная система должна строиться от других принципов:
Нужны layout-темплейты. Т.е. задание структуры (количество колонок, их состав и пр.) и общих по всему блогу элементов (header, footer, навигация) в одном месте. Конечно, в сложных случаях layout-ов будет много, но почти гарантированно один layout распространяется больше чем на одну страницу. Редактировать одно и то же в нескольких местах - глупо.
Нужны блоковые темплейты. Очевидный пример блока - это представление первых строк записи в индексах. Оно повторяется во всех архивах, в результатах поиска и так далее. Редактировать такую кучу мест - не менее глупо, чем править заголовки по всему блогу