• Авторизация


Качаю блоги 19-07-2007 12:03 к комментариям - к полной версии - понравилось!


Качаю блоги своих фрэндов и постоянных читателей на пальм. Буду в отпуске по мере возможности почитывать и записывать впечатления. Так что где-то к середине августа будет вторая часть "Мой LiveInternet".
вверх^ к полной версии понравилось! в evernote
Комментарии (21):
Balanar 19-07-2007-12:06 удалить
С таким их кол-во труд титанический.
ALEXRUS 19-07-2007-12:06 удалить
И скока это по объёму в мегабайтах будет?
Shramm 19-07-2007-12:44 удалить
удачного отдыха )
cyber_alien 19-07-2007-13:05 удалить
"Моя Борьба с LiveInternet" =))
ruisseau 19-07-2007-13:13 удалить
Ты отдохнуть-то не забудь! Отдых очень важен.
Имитатор 19-07-2007-13:27 удалить
Что, опять всех описывать будешь, или только новых?
Divo_Divnoe_II 19-07-2007-14:05 удалить
в отпуске отдыхать надо, батенька!
profhce 19-07-2007-14:16 удалить
отпуск - какое вкусное (забытое) слово. Я тут загнался завиральной идеей по "измерению" и "сравнению" блогов (путем скрещивания индексатора dtSearch/или google CSE с LingvoAnalyse покойного Д.Хмелёва). Задача формулируется так - на входе фрагмент целевого текста (например, "Декодер") - на выходе - список блогов "похожих", отсортированых по убыванию меры близости.. Бред дилетанта? - я знаю, дык свой труд ничего не стоит :)
Gatekeeper 19-07-2007-14:47 удалить
Balanar, да нет, не так уже и много. Где-то с полсотни.

Shramm, отдых будет напряженным :)

cyber_alien, борьба начнется осенью. Пока идет арт-подготовка :)

Каровьев, только новых и как обещал - тех топовиков, которых я упоминал в том посте и которых обещать обозреть.

Divo_Divnoe_II, есть такой вариант отпуска - смена рода деятельности. Вот этим и займемься. Полежать на пляже в Турции овощем в этом году никак не получиться.

profhce, а поподробнее? Хотя как по мне в любом случае ручная работа более эффективна нежели автоматика
а как скачать? научи...плииииз....в личку...плииииииз....очень прошу))
*делаю жалостливый взгляд*
=)
profhce 19-07-2007-18:34 удалить
Gatekeeper,
profhce, а поподробнее?

Подробнее так:
полнотекстовый индекс блога - статистика, по крайней мере - слова и расстояния между ними (некоторые индексы содержат больше но я в них не гуру). Традиционный запрос в виде регулярного выражения - не совсем тот механизм, чтобы искать подхдящих - сложный фильтр нужен.
Делаем так: берём репрезентативный фрагмент текста (20-50к), индексируем его, и сравниваем две статистики (с возможностью применить эвристики типа, знаки препинания, предлоги, спец_символы - {бывшие программеры легко найдутся по относительному количеству скобок и спец_символов}).
Пусть будет прообраз "фильтрационной решетки" :-)

Подробнее будет (hopefully) на моём типа_блоге, который с удовольствием переделал бы в community.
atila 19-07-2007-19:20 удалить
Ну чтож, ждем "продолжения банкета".

Татя_Космонафт, в каждом дневе есть иконка с дискетой, жмешь на нее и скачиваешь дневник по сезонам в виде xml файла.
Lurk 19-07-2007-19:33 удалить
profhce, Жуткая задача)))
В смысле жутко сложная и жутко интересная))
atila, какой кошмааар....это ж каша получается...а не текст
atila 19-07-2007-23:04 удалить
Татя_Космонафт, позвольте спросить, что за чудо-браузер вы используете? Use Firefox :)
Lurk 19-07-2007-23:05 удалить
Исходное сообщение atila: Татя_Космонафт, позвольте спросить, что за чудо-браузер вы используете? Use Firefox :)


+1))

LI 7.05.22 beta
atila 20-07-2007-23:26 удалить
Татя_Космонафт, про Opera я ничего не говорил. Ставь Firefox и все что я сказал для скачивания блогов в силе.

В IE как всегда результат говенный.(а что вы хотите от осла) =)
Tatarnikoff 27-07-2007-04:52 удалить
Gatekeeper, хорошо тебе отдохнуть!


Комментарии (21): вверх^

Вы сейчас не можете прокомментировать это сообщение.

Дневник Качаю блоги | Gatekeeper - Error 404 | Лента друзей Gatekeeper / Полная версия Добавить в друзья Страницы: раньше»