Свежие комментарии

Title Comment
что возвращает нас к вопросу о миллиарде обезьян и пишущих м

что возвращает нас к вопросу о миллиарде обезьян и пишущих машинок

<b>я тупой</b><br/> тебя забанят за слишком частые рнеквесты

я тупой
тебя забанят за слишком частые рнеквесты, так что тебе еще и потребуется сеть распределенных прокси (которая впрочем, есть легальная (я забыл название)), а делать-то тебе достаточно HEAD они в этом месте могли облажаться, но проверить-то две копейки.

тогда тебе все правильно сказали френдлена совсем не годитс

тогда тебе все правильно сказали

френдлена совсем не годится
возожно, прямой пинг по http будет несильно быстрее, чем подписка. И ТОЧНО надежнее: все жжшные алерты надежно глючат. Почтовый кластер у них вообще любит чудить.

Дергать, очевидно, лучше RSS с заголовками

Ну теперь даже не надо спрашивать что за сервис планируется,

Ну теперь даже не надо спрашивать что за сервис планируется, он называется: "первый нах" :-)

Для того сервиса, который я обдумываю, первые пропущенные се

Для того сервиса, который я обдумываю, первые пропущенные секунды могут быть критичными.

Проблема в том, что мне не надо весь ЖЖ. Наоборот, мне надо

Проблема в том, что мне не надо весь ЖЖ. Наоборот, мне надо конкретных пользователей, но максимально быстро.

Уведомления о новой записи юзера включаются через кнопку в е

Уведомления о новой записи юзера включаются через кнопку в его профиле. Или так - http://www.livejournal.com/manage/subscriptions/user.bml?journal=someuser

О. IM - хорошая идея. А лимиты пока не волнуют, хочется отт

О. IM - хорошая идея.

А лимиты пока не волнуют, хочется оттестироваться, поток тестеров я смогу
сам регулировать, не проблема. А если пойдет, то и целиком выкачать не такая проблема.

Тогда только создавать отдельные аккаунты, вписывать в друзь

Тогда только создавать отдельные аккаунты, вписывать в друзья (а на их число есть лимит, как есть и лимит на количество добавленных за день) и ставить в настройках крыжик "уведомлять на IM, если кто-то из друзей напишет пост". Ну, и держать запущенный джаббер для приёма этих самых уведомлений...

В тех масштабах, что мне нужны, - это из пушки по воробьям.

В тех масштабах, что мне нужны, - это из пушки по воробьям. Даже в самых смелых мечтах мне больше нескольких тысяч записей в день не нужно, это процент от русскоязычного ЖЖ и о-малое от ЖЖ вообще.

Их средствами - нет. Фильтровать придётся самому. Это ж фид

Их средствами - нет. Фильтровать придётся самому. Это ж фид для поисковых машин.

<b>Re: Веб сервисы:</b><br/> в попфлай регистрация по инвайт

Re: Веб сервисы:
в попфлай регистрация по инвайту. если нужен, то у меня 5 штук валяеца :)

насчЁт суррогатов: так ведь оно практически всегда так, но не писать же всЁ самому :)

Да, что-то уж слишком маленький интервал. :) Я, конечно, не

Да, что-то уж слишком маленький интервал. :)
Я, конечно, не так часто ленту проверяю, но решение такое нашёл: создал группу друзей в ЖЖ RSS , затем эту ленту по RSS читаю.

Вообще, Яндекс ведь мониторит ЖЖ. И делает запросы к нему, по всей видимости, гораздо чаще, чем 10-15 секунд. Значит можно попробовать.

А раз в минуту уже не пойдет?

А раз в минуту уже не пойдет?

А там можно наложить фильтр по тем юзерам, которые меня инте

А там можно наложить фильтр по тем юзерам, которые меня интересуют ?

чтобы узнать,что конкретный юзер написал пост можно через оп

чтобы узнать,что конкретный юзер написал пост можно через определенное время парсить его юзеринфо(либо в html-формате, либо в foaf) http://xc0der.livejournal.com/profile?mode=full (http://xc0der.livejournal.com/data/foaf),в них есть поле "последняя запись", содержащая дату и время последней записи. но есть способ лучше - мониторить общую ленту всего ЖЖ в html - http://www.livejournal.com/stats/latest.bml или xml - http://www.livejournal.com/stats/latest-rss.bml . Первый способ хорош тем, что возможно узнать об обновлении жунала даже если это friends-only или private запись. в общую ленту, понятное дело, попадают только public записи.
еще может пригодится bot policy - http://www.livejournal.com/bots/

http://updates.sixapart.com

http://updates.sixapart.com

<b>Re: Веб сервисы:</b><br/> Да, я буду смотреть. Оно хочет

Re: Веб сервисы:
Да, я буду смотреть. Оно хочет MS Passport, а я свой проэтосамое, надо новый заводить и что-то сейчас не хочется.

На самом деле, у меня серьезная проблема в другом месте. В результате обсуждений я _знаю_ как этот сервис должен выглядеть. Или думаю что знаю.

Соответственно, с суррогатами начинается игра "тараканы". Борюсь с ней, а то ведь придется делать самому.

Скажи пожалуйста, а MTLJpost с MT 2.64 хорошо работает?

Скажи пожалуйста, а MTLJpost с MT 2.64 хорошо работает?

<b>Re: Веб сервисы:</b><br/> попфлай помощнее. правда, нашЁт

Re: Веб сервисы:
попфлай помощнее. правда, нашЁт последних 2х пунктов - хз, не проверял.

Сам не пользовался, прочитал о нем здесь - http://blog.guyka

Сам не пользовался, прочитал о нем здесь - http://blog.guykawasaki.com/2007/10/reality-check-f.html

Жопа. Вместо русских букв знаки вопроса. А как дысал...

Жопа. Вместо русских букв знаки вопроса. А как дысал...

<b>Re: Веб сервисы:</b><br/> Pipes обосрались, на мой взгляд

Re: Веб сервисы:
Pipes обосрались, на мой взгляд. Т.е. решаются только две задачи из пяти (фильтрация по кейвордам), ну да это может любой разумный читатель.

При этом в пайпах нету даже фильтрации без учета регистра, я попросил не показывать мне iphone в subject и успешно вижу iPhone

Ага, похоже на правду. Подписался, посмотрим. Правда пока в

Ага, похоже на правду. Подписался, посмотрим.

Правда пока вижу это:

Important note! Thanks to the enthusiastic response to our launch last week at DEMOFall, plus continuing positive coverage this week, we are a bit overwhelmed with the number of new feeds being created and are actively beefing up our infrastructure to meet the demand. While you can normally expect to see new content in your feed every 3-4 hours, it will currently take 24 hours to start getting content in your new feed.

http://www.feedhub.com/

http://www.feedhub.com/

Newzcrawler делает все, кроме пункта 3. Пользуюсь уже два го

Newzcrawler делает все, кроме пункта 3.
Пользуюсь уже два года, только по ключевым словам и читаю. А группировку по тематикам делаю сама.

Правда не обновляется с 2006 года :(

Еще есть монстр из "старенького" - Omea от JetBrains - тот, помимо всего прочего, еще и всю возможную инфу (с диска, из Аутлука и пр.) в одном месте сохраняет.

А из новенького и обновляемого - Awasu - может быть, они и до пункта 3 со временем дойдут (развиваются активно). Там можно даже собственные правила в несколько кликов создавать (например, изменился курс доллара на энное количество пунктов (RSS курсов валют) - выскочила напоминалка об этом эпохальном событии.

На мой взгляд, принципиально важно именно кластеризовать по

На мой взгляд, принципиально важно именно кластеризовать по близости тематики, чтобы это было основным view.

Т.е. вообще отойти от понятия "лента с определенного источника" (или с группы источников), источников много и они пересекаются.

<b>Веб сервисы:</b><br/> &lt;a href=&apos;http://pipes.yahoo

Веб сервисы:
<a href='http://pipes.yahoo.com/pipes/&apos;>Yahoo Pipes</a> и <a href='http://www.popfly.ms/&apos;>MS Popfly</a>. Вроде есть ещЁ какие-то.

Так ключевая фраза - &quot;яндекс-новости для (выбранных пол

Так ключевая фраза - "яндекс-новости для (выбранных пользователем) RSS-лент" уже прозвучала, что тут обсуждать.

В смысле кластеризации, мне кажется разумнее трехуровневая Новотечная модель, но не исключаю, что причина в том, что я к ней приложил руку.

Группировать дубли и похожие документы можно просто по TF*IDF

Перечитал еще раз - нет, до такой эвристики еще никто не док

Перечитал еще раз - нет, до такой эвристики еще никто не докатился.

Pages

Subscribe to comments_recent_new