29 августа Яндекс провел открытый семинар под очень заманчивым заголовком – "Как пользователи могут влиять на ранжирование". Игорь Кураленок, руководитель службы оценки качества поиска Яндекса, рассказал о том, что поведение пользователей на странице с поисковой выдачей может дать ценную информацию для улучшения качества поиска.
Для этого можно учитывать, например, сколько времени пользователь провел на странице выдачи, по скольким ссылкам он кликнул и по каким именно, статистику посещаемости сайтов, редактирование пользователем запроса в рамках одной сессии, последовательность заданных в рамках одной сессии запросов. К сожалению, анализ сессий запросов плохо работает с высокочастотными и низкочастотными запросами, хотя и по разным причинам. Сложно "угадать" и почему окончилась поисковая сессия – человек нашел то, что искал, или же выдача не понравилась ему настолько, что он ушел на другой поисковик.
Есть множество факторов, препятствующих корректному учёту данных. Во-первых, необычные формы пользовательского поведения – скликивания и флешмобы. Во-вторых, по сайтам в выдаче зачастую производятся нелогичные клики – например, порносайт в выдаче по пластиковым окнам, по такой ссылке многие кликнут от неожиданности или из любопытства. В третьих, пользователь может узнать то, зачем пришёл на поиск, из сниппета и не "проголосовать" за сайт кликом. Есть тут и своеобразный порочный круг: чем выше сайт отранжирован, тем чаще по нему кликают, а чем чаще кликают – тем выше его, соответственно, нужно поставить.
Прозвучал на семинаре термин "голосующий клик". Если определенное количество разных пользователей кликают на один и тот же сайт в выдаче по одному и тому же запросу, то их клики становятся "голосующими" и их можно учитывать при ранжировании сайта. Выдача становится более привлекательной и разнообразной, "о релевантности мы пока не говорим", - отметил докладчик. Естественно, не было сообщено, сколько именно раз нужно покликать на ссылку, чтобы клики стали голосующими.
Поведение пользователей - хороший источник информации о качестве выдачи, но эту информацию очень сложно использовать при ранжировании. Если её использовать просто и непосредственно, в выдаче начинается хаос. Поэтому она используется очень косвенно и сложно.
Поведение пользователей исследуют практически все крупные поисковые системы. Но например Google использует эти данные пока только для настройки персонализированного поиска под потребности конкретного пользователя. В рамках экспериментальных программ пользователям позволяется вообще формировать выдачу самостоятельно, переставляя местами любые сайты – но увидит такую выдачу только сам её создатель. Яндекс же попытается идти по пути генерализации (от слова "обобщение") – влияние факторов, учитываемых при ранжировании, на выдачу у всех пользователей.
При подготовке материала мы уточнили у Игоря Кураленка два главных момента:
Методики учёта поведения пользователей при ранжировании имеют сугубо экспериментальный статус или уже работают в поиске Яндекса?
Существует ограниченный перечень типов данных, из которых выжимают десятки и сотни факторов ранжирования. Поведение пользователей на выдаче является еще одним перспективным типом данных. Деление факторов на экспериментальные и боевые условно, потому что машинное обучение алгоритмов определяет вес фактора в соответствии с тем, насколько хорошо он позволяет предсказывать релевантность. Поэтому все удачные факторы, конечно, будут использоваться для улучшения поиска Яндекса.
Есть ли смысл кликать по своим сайтам в выдаче, чтобы они поднялись повыше?
Технология фильтрации накрутки в Яндексе имеет многолетнюю историю, например, для Директа. Мы умеем отсеивать клик-боты.
( Полная версия статьи опубликована в "РВ" - расширенном выпуске
нашей рассылки, см. Архив )
Подписаться на "РВ" можно здесь -
http://www.optimization.ru/subscribe/money.html