Давече у многоуважаемого Gatekeeper в треде «Форсированная раскрутка блога», прозвучало мнение Rost следующего характера цитата :
«А что касается рейтингов, то по мне самый лучший рейтинг - сумма постоянных читателей твоих постоянных читателей. Жаль, что такого рейтинга на ЛиРу нет. Очень жаль.»
Потом BJohn, уже в личке, говорил о том, что неплохо было бы написать программу, которая считала бы рейтинг, способом который предложил Rost. Я естественно не мог отказаться и принялся за работу.
Алгоритм работы такой: парсим хтмл указанного блога на предмет количества пч и ссылок на их дневники. Далее проходим по каждому дневнику этим же парсером и считаем общий балл. Все хорошо, пока у блога не более 10 пч. 10 страниц получить не сложно и довольно быстро. Сложности начинаются когда пч больше. Время подсчета значительно увеличивается, так же увеличивается трафик, который ест программа.
Сейчас пытаюсь придумать что-то интереснее но в голову пока ничего не приходит. Есть идеи?
Исходное сообщение Sebastian_Valmont: А ты учел что ссылка может вернтуть тебя обратно? Типа я твой Пч - то есть я попал в первый круг, но допустим ты тоже мой ПЧ и тогда во втором круге ты посчитаешь всех пч, что были в 1 круге...Никакого цикла ен будет потому что мы считаем только количество пч твоих пч. Там никакого зацикливания и быть не может. Что-то интеестнее надо. Да вот только что-то дельного в голову ничего не приходит. Валю просить бессмысленно.
Вообще тут надо что-то более интересное... А времени стопудово будет много...
Я вижу только алгритм: берешь всех из первого круга и целиком записываешь в массив
Потом для каждого из первого круга считываешь пч второго круга при этом записывая их в первый же массив таким образом чтобы ники не повторялись... Потом просто прогоняешь весь массив и считаешь число элементов...
А вообще проще Валеза попросить на сервере считать.. Хотя там фигня будет в повторяемости...
Исходное сообщение jSlepoi я ужо сказалъ! Кстати, вроде счётчик комментов всех есть....Представляю рейтинг после 20-титысячника :))))
Исходное сообщение Lurk:Хорошо, можно взять 2000 страниц. Это будет 40 000 дневиков. Суть одна - считаем такой рейтинг один раз в неделю.Rost, Т.е. ты предлагаешь один раз в день парсить 1000 страниц. Это 20 000 дневников. А на лиру по моему их гораздо больше. У меня в базе уже 235 126 дневников. Только с лиру.
Исходное сообщение Lurk:Яндексу это скажи :)Rost, Раз в неделю, не совсем актуальный рейтинг получиться...
Исходное сообщение Lurk:Занимался бы у нас фирма хостингом...Rost, дал бы кто площадку))
Исходное сообщение Lurk:Если бы я отвечал за сайт, то легко бы разместил. Но, увы, я специалист другого профиля.Rost,
Ну, яндекс, он же вон какой)))
Т.е. можно на халяву разместить скрипты? ))