Был миллион? Нет миллиона!

Поковырял 10 минут детектор доменных паркингов на черном квадрате и все сломалось. Недавно отмечали миллион на квадрате, на прошлой неделе было еще чуть больше (1007012) "настоящих живых сайтов", а стало 928332.

Ну значит еще раз инфоповод будет, где-то осенью... Если, конечно, не выяснится, что паркингов еще больше.

Comments

А как Вы отличаетет паркинг например от не паркинга?

Там есть разные способы. Но суть сводится к тому, что на близких адресах живут очень похожие (по извлекаемому тексту) сайты.

Я, на самом деле, очевидно не все объял.

а кто "кролит", тоже китайцы ?
как отсекаете "неарли дупликейтс" ? (интерес чисто "платонический".. есть у меня любопытная статейка на эту тему, но применима к достаточно объёмным текстам).

PS: пора уже "в середину" встраивать "белый квадрат" - wap-контент ,-)

У вас основной RSS канал отдается в HTML формате. FeedDaemon криво обрабатывает его. Может поправите?

Это фидбернеровский smartfeed. Отдается в соответствии с предпочтениями клиента.

Я его читаю FeedDemon-ом без каких-либо проблем.

Странно, просто именно этот канал в FeedDemon у меня отдается в виде HTML со всеми HTML конструкциями. С остальными такого не наблюдается. Ну хай будэ... ))

URL канала какой ?
Такой: http://feeds.lexa.ru/lexaru-blog ?

У меня зимой была перестройка, вроде я все варианты URL-ов RSS поредиректил на этот, но мог и пропустить что-то.