Яндекс.Цитирования сайтов рунета

Наваял очередную нетленку Яндекс.Цитирования сайтов рунета в 4-м квартале 2006 г - обзор изменений ТИЦ с октября по январь по ~200 тысячам сайтов. Основные выводы:
  • ТИЦ серьезно упал, примерно на четверть (если брать средние значения)
  • В наибольшей степени это коснулось сайтов с относительно высокими ТИЦ, если ТИЦ был более 100, то с вероятностью 85% он упал
  • Письма из поддержки Яндекса "тиц упал у некоторых сайтов" - это явное преуменьшение размеров проблемы
наслаждайтесь чтением

Comments

Отличная статья по которой можно провести много дополнительных исследований, да и статистика отличная :)

Если, как описывает автор статьи, прошла переоценка ссылочной базы - то скорее всего Яндекс начал активно бороться с оптимизаторами. Массовые изменения ТИц внесли смуту в ряды продавцов ссылок, кто-то просит за ссылку столько же, кто-то говорит что т.к. это массовое, то зачем снижать цены... Интереснее будет узнать в какую сторону изменится релевантность выдачи. Но, я считаю, что с уверенностью можно сказать - Яндекс все больше и больше отходит от ссылочного ранжирования и переходит к соответствию контента относительно запроса.

Яндекс, естественно, борется с накачкой ссылками, каталогами, псевдосайтами и так далее.

Собственно, Садовский на осенней конференции довольно подробно рассказывал что они считают плохим сайтом.

Другой вопрос, что на сегодня есть два основных типа критериев ранжирования:
- внутренние (контент в первую очередь)
- внешние (ссылки в первую очередь)

Про контент: если начать давать ему бОльший вес чем сейчас, то мы вернемся в ситуацию начала века, когда сгенерированная "под ключевики" страница вылезала по частотным запросам (сейчас вылезают только доры по низкочастотным).

Про ссылки: можно как-то ранжировать источники ссылок, давать trust rank и так далее. Это приведет либо к снижению оперативности (trusted-источников мало), либо к повышению цены ссылки с trusted-источников (которых будет много).

По обе стороны поискового индекса сидят люди, мотивированные рублем. Одни - зарплатой в поисковике, другие - клиентскими деньгами. Будет как с почтовым спамом, разве только цена ложного срабатывания ниже.

После пересчета тИЦ существенных перестановок в Яндекс.Каталоге по моей "любимой" тематике не наблюдаю. От снижения веса ссылок с каталогов (а таковыми на разных этапах своего существования не брезговало большинство сайтов с искусственно накрученным тИЦ) особо никто не пострадал - все выстроились почти в старом порядке, но с другими цифрами. Что характерно, это категория каталога - почти замкнутая, за 2006 год в нее не добавили ни одного крупного игрока.

Конкретно в этой тематике исключением стал официальный сайт марки Pioneer, которому урезали тИЦ пунктов на 50 (или совсем не урезали - не мониторил), но теперь, по праву, этот ресурс в местном ТОПе (как белый, пушистый и популярный). Существенное падение остальных тоже обосновано - старые ресурсы исторически все были перелинкованы естественным образом по "самое небалуйся", и, падая, утянули за собой и самих себя, и более "свежие" сайты в тематике. На вскидку, суммарный вес тематики упал не менее, чем на 50% (судя по беглому взгляду на первые страницы ТОПа ЯКи).

Соотвественно, эта группа сайтов, в целом, достаточно быстро снова наберет вес: с появлением новых доноров, с ростом веса доноров из других тематик. И в выдаче, как бы не меняли алгоритмы, ситуация еще долго не изменится - незачем вводить trust rank, когда все игроки и так "налицо". Даже циркуляцию контента можно отследить непосредственно по выдаче и по датам индексации статей.

Спасибо за анализ.

IMHO, trust rank будет, и он будет привязан к возрасту домена и его репутации. Также, по опыту зарубежных коллег стоит ожиать обязательной sandbox для новых сайтов.

Вещь! А вы Алексей, оказывается еще и гений :-))) Несмотря на раздражительный характер.
Перечитывал 3 раза.

У трастранков и песочниц есть серьезный недостаток - резко теряется оперативность.

И если для толстых запросов это не имеет значения - ну какая разница, какой сайт будет вылезать по пластиковым окнам или ОСАГО, - то для низкочастотников , где представительность мала задержать на полгода публикацию единственного в тьмужопинске сайта по запросу "аренда авто в тьмужопинске" - это поощрять доры по тому же запросу.

Леша, посмотри, пожалуйста, цифры в таблице "Обнуленные сайты".

Ага, спасибо, я там для красоты врисовал пробел
и нарисовалась лишняя единичка.

Правильное количество редиректов - 1106

Может быть Яндекс скупил все базы каталогов и сильно уменьшил вес ссылок с них ? :-) Картинка похожая получилась бы.

С таким анализом строго фсад. Где выводы? Где гипотезы? Ничего нет, одна констатация фактов. Что вылетают сайты-мусорки и так понятно.

Повторюсь, почему ТИЦ снизился у сайтов - нет ни одной гипотезы. Хотя было бы очень интересно подтверждение или опровержение гипотезы, что улетели ссылки в которых присутствует название домена сайта латинскими буквами. Имхо это единственная жизнеспособная гипотеза.

Тем не менее спасибо за проделанный труд. Но мотивации Вам не хватает. Как и разумной критики и пинания ;). Поверьте, Вы смогли бы тогда намного больше.

А кому нужен сайт, рассказываюший об "аренде авто в тьмужопинске"?

Этот запрос может замечательно указывать на специальную страничку на avto.ru. У них еще не достаточно контента, чтобы охватить ударную долю тематических запросов?

Разве Гугл ищет одностраничный киносайт тьмужопинского веб-мастера при наличии IMDB? Или полтора миллиона еще не охватили каждый 2 запрос Гугла?

Snake,

Я, к сожалению, не яндекс. У меня нет текстов всех ссылок.

А анализ ссылок с морд (не всех, а только RU/SU) - запланирован, конечно.

Sebe,
пример с "аренда авто, областной центр" - это хрестоматийный пример доров.

Snake, решил ответить поподробнее.

1. Что ТИЦ упал "у всех" - это результат и его не стыдно. Что ТИЦ упал у подавляющего большинства сколько-нибудь толстых сайтов - тоже результат и тоже не стыдно (а вовсе не у помоек, у нас все-таки не 85% помоек)

2. ТИЦ считается по ссылочным факторам (в первом приближении: сами ссылки, близость тематик по каталогу, близость тематик по скрытой части каталога, близость тематик, определенных автоматическим роботом от Директа).

3. Доступны ли эти факторы по наблюдениям снаружи ? Да, в теории можно запросить бэки (но, цитируя Садовского, а "с чего вы взяли, что все показываемые бэки - учитываются при ранжировании"). Для сайтов из видимой части каталога - можно смотреть тематики.
Для морд - у меня есть ссылочная база, но этого мало. Для всего остального - надо быть Яндексом т.е. иметь доступ к реальным ссылочным данным.

4. Хочется ли заниматься пунктом 3? Да нет, пусть Трофименко в BDBD строит убермашину, которая будет давать яндексу запросов на $50k в месяц и хранить терабайты данных.

5. Вот что действительно не сделано и это упущение - это не сделан анализ изменений ТИЦ для сайтов в каталоге отдельно. Это я исправлю.

По пунктам.

1. Что упал - пофигу. Если бы падал равномерно - другой вопрос, а так фигня и интересны ее причины.

2. Согласен

3. Я не монстр SEO поэтому и интересуюсь возможно ли это (понял что Вашими силами - нет). Просто считаю, что мой сайт - довольно характерный пример. На момент прошлого пересчета ТИЦ 1500. Затем была выполнена регистрация в каталогах и прочая хрень. На данный момент - 600. Но при обмене по тематике и при проставлении на меня ссылок (именно так получился 1500) очень часто в ссылке использовалось либо слово Fenzin либо Fenzin.org. Особенности позиционирования, так сказать. Направленные, как мне казалось, на запоминание именно домена. Вот яша его и запомнил :).

По остальным пунктам претензий не имею ;)

Обязательно нужно сделать анализ изменений ТИЦ для ЯКа!

Snake,

мне так кажется, что проблема именно с регистрацией в каталогах. Если их порубали для всех - то у всех и упадет.

Алекс, еще раз повторюсь. У меня ТИЦ 1500 был БЕЗ РЕГИСТРАЦИИ в каталогах. Это что - за регистрацию мне ТИЦ скрутили?

Мой сайт, который в подписи, потерял ТИЦ от 190 до 140, позиции не изменились, но вчера просто тупо пропал из выдачи по двум самым главным ключевым словам, причем совсем. Месяца 3 с сайтом ничего не делал, спама там нет, а вчем причина не пойму... Может кто знает?

Кстати по сайтам, у которых ТИЦ до 100 никаких изменений.

По-моему, обсуждать выдачу Яндекса последних дней просто нет смысла. Там трава забористая попалась.

Спасибо за анализ!

Чисто субъективные впечатления от просмотра динамики тица и последних красот в выдаче - эксперименты на тему некоего дополнительного параметра. Скорее всего, действительно нечто сродни всяким трастранкам. Покашнее засилье доров, вполне возможно, свидетельствует о кривоватости эксперимента, но в целом все довольно симпатично. Если, естественно, доведется до ума. Вижу пару совершенно нелогичных и необъяснимых вещей, но нужно потерпеть пару апдейтов.

У меня просто каталог (правда, в сети только с 4-ого ноября). И ТИЦ рос так - 0-100-120. 120 на 27.12.2006. Поэтому не думаю, что наложены на каложные сайты или на ссылки с каталогов.

Если публикация статей на тему Тиц не связана с работой, то я немного разочарован...

Статейка в тему http://michael.mindmix.ru/47-381-lzhenauka.zhtml .

Когда писал эту статью, не хватало живых примеров. Теперь пример имеется. К сожалению...

Лженаука в чистом виде. Как и все попытки описать явления количественно, не имея полных данных по ключевым параметрам.

Для сложных систем мне известно довольно мало исключений.

И ТИЦ-PR - это фигня на фоне технического анализа рынков акций. Но делают теханализ и деньги там крутятся побольше, чем в SEO. Потому и делают.

Это рекламная ФИШКА чтобы на YA обратили внимание :)

обратили внимание только 0,01% рунета ;)

Алексей, а есть ли в общедоступной природе ;) информация о кол-ве сайтов в группах по значению тИЦ, скажем тИЦ от 0 до 100 - Х сайтов, от 100 до 500 - Y сайтов и т.д.?

Есть мои данные на октябрь 2006

http://www.rukv.ru/analytics-200611.html

Но это только по сайтам вида [www].domain.ru

О, и правда, забыл ведь, что видел их в том исследовании. Спасибо!

Господа, в тему тИЦа предлагаю всем почитать статью о том, что же все таки произошло с тИЦем под новый год -

Залоговок:
Яндекс делает подарки всем SEOшникам в честь Нового года!

Адрес
http://tutmedia.com/ya.html

а кто знает когда будет следующая переиндексация с тицом?

яндекс КАЗЛЫ, опять рубанули яИЦ , чтоб и пусто было.

Нафиг нужен этот ИЦ, ведь а врезультатах выдачи, с него тольку мало, все выдается по релевантности ссылок.

Добрый день Алексей

В статье для логарифмирования ТИЦ Вы используете формулу:

Lcy = ROUND(ln(cy)/1.375),1)

А почему коэффициент 1.375 ? А не скажем 1.386 ? Почему так? Это просто наилучший подбор? Или другие причины?

Естественно, это наилучший подбор. Чтобы результат формулы попал бы в тот же диапазон, что и значения Pagerank

А подбор шел с шагом 0.025 ? - или число 1.375 само сабой получилось такое круглое?

Я что так до "мелочи" допытываюсь - по моим соображениям число 1.386 несет больший смысл, чем 1.375. И если последнее - просто наиболее близкое приближение к первому - то и слава Богу.

Но вполне может быть, что точности Вашего исследования достаточно, чтобы твердо сказать, что число все таки ДОЛЖНО быть 1.375, а 1.386 не подходит - вот это и хотелось бы знать. Прокоментируйте пожалуйста.

Я не знаю, в чем волшебность числа 1.386

А 1.375 получено очень просто - максимум ТИЦ на момент вывода формулы был 236800. После логарифмирования и округления хотелось получить 9 ровно. Неокругленное значение делителя получается 1.3749967979991097409897190343499

Большое спасибо за исчерпывающий ответ. И вообще за все ваши исследования - мне кажется они очень полезны, наглядны и поучительны - во всяком случае для меня.

Алексей, а слишком ли большой наглостью и безумством будет попросить у Вас сырые данные по этому исследованию? Интересует весь массив ТИЦ и таблица частот PR ? (конечно же без доменных имен)

Последние Апы ТИЦ подтверждают эту теорию.

А всё-таки, я согласен с периодически проскакиваем мнением, что тИЦ - это от лукавого. и ничего он реально не даёт, кроме самодовольства от цифры на кнопочке (если она большая). Вот Яху - такой порнухой не занимается, а алгоритм у него значительно лучше. Быстрее и качественнее индексирует новые сайты.
http://cczy.unlimitedandfree.com/

А чё то маловато ссылок на Яндекс?!
Или автор на кого то другова работает?

Точно такая же ситуация повторяется и сейчас. Яша звереет(((