• Авторизация


Как найти картинку в сети? 10-11-2009 19:34 к комментариям - к полной версии - понравилось!

Это цитата сообщения AlenkaSC Оригинальное сообщение





В Сети ежегодно появляются около 100 миллиардов изображений. Цифра внушительная, и, чтобы хоть как-то с ней справиться, необходимо совершенствовать критерии поиска. Работа в этом направлении в последнее время активизировалась, и кое-какие интересные результаты могут изменить наше отношение не только к визуальным, но и к обычным текстовым запросам.

 

Стандартный подход к "графической" проблеме выглядит достаточно просто. В том смысле, что ведущие поисковики, как, например, Google с его системой PageRank, полагаются в первую очередь на хорошо известную методику оценки релевантности контекста.

 

В основном анализируют содержание интернет-страницы, где расположен тот или иной объект. То есть если вы на своём сайте поместили сочинение на тему "Как я провёл отпуск на Багамах" с фотографиями собственной персоны, на запрос "Багамы" машина выдаст именно ваши весёлые улыбки. Разумеется, в случае популярности ресурса.

 

 

 

[478x317]

В самом простом своём варианте визуальный анализ подразумевает анализ совпадения цветов и яркостей участков двух изображений. В более продвинутом – сопоставление соответствующих точек. На данном примере видно, как все вариации на тему "Джоконды" программа сравнивает с оригиналом и друг с другом (иллюстрация Yushi Jing, Shumeet Baluja).

 

Принимаются во внимание и названия графических файлов (например "Я_на_Багамах.jpg"), и ряд других параметров. Однако "картинка" в подавляющем большинстве случаев никак не учитывается – слишком сложная задача.

 

Даже в рамках заданных понятийных категорий (то есть программа знает, что надо искать самолёты, к примеру) существующие технологии поиска "похожих" изображений неидеальны.

 

Наибольший прогресс в этом направлении достигнут в области распознавания лиц и фотографий – в настройках расширенного поиска "Гугла" или "Яндекса" такие опции уже предусмотрены. Есть и специализированные ресурсы, работающие с визуальными запросами, как, например, Riya, TinEye или Picollator.

 

Все они так или иначе используют технологию поиска изображений по содержанию – CBIR (Content Based Image Retrieval). Методика эта позволяет оценивать сходство рисунков или фотографий на основании их цвета, текстуры, формы и, реже, других параметров.

 

 

 

[478x511]

Загрузив фото Арнольда на Picollator, мы получили такой вот набор лиц. Нет, всё, конечно, можно понять, но за дам обидно. Видимо, сервис пока ещё сыроват

 

В основном это реализовано на достаточно скромном уровне. То есть сервисы анализируют совпадения цветов и яркостей соответствующих друг другу участков сравниваемых изображений или, например, взаимное расположение каждой пары точек объекта.

 

Как видите, даже в лимитированной базе фотографий сервисы работают не очень успешно. Хотя теоретически для фото можно было бы разработать систему, аналогичную по своей точности анализу отпечатков пальцев.

 

Однако для поисковика с неограниченным количеством индексируемых изображений это будет слишком дорого. А самое главное – долго: результатов выдачи в течение нескольких (в лучшем случае) минут не многие пользователи готовы дожидаться.

 

Ещё одним и даже более фундаментальным ограничением является сложность механизма зрительного восприятия человека. Основная проблема здесь – разрыв восприятия или так называемый семантический разрыв.

 

 

 

[478x449]

Сервис TeenEye предлагает найти похожие фото и изображения относительно указанного образца. На деле в ходе серии загрузок портретов известных людей мы получали одни и те же фото, отличающиеся лишь по размерности, яркости и чёткости, – порой на 20 страницах.

 

Если перевести на обычный язык, это означает, что не всегда возможно сознательно сформулировать "правильный" текстовый запрос – по крайней мере, если речь идёт о поиске. Один пользователь, вводя слово "солнце", ожидает увидеть звезду в окружении планет, а другой – лужайку, голубое небо и много-много света.

 

Но в этой сложности и кроется значительный потенциал. Только представьте: вы только подумали о чём-то, родился в голове какой-то образ, мелькнула неясная мысль – и вы ищите соответствующую картинку. А уж дальше получаете необходимую информацию.

 

Впрочем, просто найти "желаемое" изображение, даже не абстрактное, а вполне конкретное, – тоже совсем неплохо.

 

 

 

 

 

 

 

 

 

 

В общем, интернет-поиск – это та область, где прогресс в буквальном смысле не стоит на месте.

 

Вполне возможно, что в ближайшем будущем можно будет совершенно спокойно отрефлексировать свой архетип, найдя единомышленников по картинкам из сновидений, или научиться наконец без проблем находить "то-не-знаю-что".

Не менее важна оценка имущества при разделе собственности. А вы как думали? Это важная составляющая любого бизнеса.

вверх^ к полной версии понравилось! в evernote
Комментарии (1):


Комментарии (1): вверх^

Вы сейчас не можете прокомментировать это сообщение.

Дневник Как найти картинку в сети? | yppi - Дневник yppi | Лента друзей yppi / Полная версия Добавить в друзья Страницы: раньше»