• Авторизация


Словарный запас. 27-12-2008 22:53 к комментариям - к полной версии - понравилось!


Как вы все, наверное, знаете я являюсь автором такого вот приложения для лиру как "Словарный запас". И довольно долгое время, индексатор, который обсчитывает новые посты был отключен в связи с неимоверной нагрузкой на сервер. И вот свершилось чудо. Прошлой ночью я запустил полностью переписанный индексатор.

Изменения в текущей версии:

  1. Индексируются только блоги у которых есть оценки на проекте BlogRIder.ru. Связанно это с тем, что мы получаем новые посты только с дневников у которых есть оценки.
  2. Индексируется только последние 150 постов. Опытным путем было установленно, что разница в конечном результате при индексации большего количества постов не более 5%.
  3. Обновление индекса происходит не чаще чем раз в месяц.
  4. Обсчитывается 1000 самых используемых слов во всех блогах. (пока не выводится)
  5. Обсчитывается 100 самых используемых слов в блогах друзей. (пока не выводится)

 

вверх^ к полной версии понравилось! в evernote
Комментарии (3):
Lurk до сих пор не нашлись падонки которые грузят сервер? хехе А какие перспективовозможности даёт вот такой обсчёт слов?
Lurk 28-12-2008-23:41 удалить
Ответ на комментарий нольвосьмой # нольвосьмой, Кроме меня никто такой херней не занимается :) Это я вечно, то поиск по блогам сделаю. То ТИЦ начну считать:) То вот словарный запас :) Кому? :)
Lurk чтобы мы без тебя делали! )) ТИЦ? Словозаготовителям наверное )) Кстати можно сделать херню под названием - "мне интересно интересы моих почитателей", может какую закономерность там получиться выявить типа димы белана и стонхэнджа ) LI 7.05.22
Lurk 29-12-2008-15:10 удалить
Ответ на комментарий нольвосьмой # нольвосьмой, Померли бы :) Тематический Индекс Цитирования. (Типа того что яндекс выдает за рейтинг) Пока в закрытом виде у меня считатся. База маловата для какой-то более или менее адекватной оценки. Будет несколько плюшек. Которые начнут работать после нового года. Во первых будет показываться топ100 слов которые используют френды. Во вторых будет показываться 10 человек у которых топ100 слов максимально похож на топ100 твоих слов. В третьих будет показываться 10 человек у которых топ100 слов максимально похожи на топ100 слов френдов. В четвертых (это совсем в будущем) будет топ 1000 слов по гео признаку, по блог сервису. Как то вот так :)


Комментарии (3): вверх^

Вы сейчас не можете прокомментировать это сообщение.

Дневник Словарный запас. | Lurk - Тренируй свой Дзен. | Лента друзей Lurk / Полная версия Добавить в друзья Страницы: раньше»