В Сети ежегодно появляются около 100 миллиардов изображений. Цифра внушительная, и, чтобы хоть как-то с ней справиться, необходимо совершенствовать критерии поиска. Работа в этом направлении в последнее время активизировалась, и кое-какие интересные результаты могут изменить наше отношение не только к визуальным, но и к обычным текстовым запросам.
В основном анализируют содержание интернет-страницы, где расположен тот или иной объект. То есть если вы на своём сайте поместили сочинение на тему "Как я провёл отпуск на Багамах" с фотографиями собственной персоны, на запрос "Багамы" машина выдаст именно ваши весёлые улыбки. Разумеется, в случае популярности ресурса.
![]() |
![]() В самом простом своём варианте визуальный анализ подразумевает анализ совпадения цветов и яркостей участков двух изображений. В более продвинутом – сопоставление соответствующих точек. На данном примере видно, как все вариации на тему "Джоконды" программа сравнивает с оригиналом и друг с другом (иллюстрация Yushi Jing, Shumeet Baluja). |
Принимаются во внимание и названия графических файлов (например "Я_на_Багамах.jpg"), и ряд других параметров. Однако "картинка" в подавляющем большинстве случаев никак не учитывается – слишком сложная задача.
Даже в рамках заданных понятийных категорий (то есть программа знает, что надо искать самолёты, к примеру) существующие технологии поиска "похожих" изображений неидеальны.
Наибольший прогресс в этом направлении достигнут в области распознавания лиц и фотографий – в настройках расширенного поиска "Гугла" или "Яндекса" такие опции уже предусмотрены. Есть и специализированные ресурсы, работающие с визуальными запросами, как, например, Riya, TinEye или Picollator.
Все они так или иначе используют технологию поиска изображений по содержанию – CBIR (Content Based Image Retrieval). Методика эта позволяет оценивать сходство рисунков или фотографий на основании их цвета, текстуры, формы и, реже, других параметров.
![]() |
![]() Загрузив фото Арнольда на Picollator, мы получили такой вот набор лиц. Нет, всё, конечно, можно понять, но за дам обидно. Видимо, сервис пока ещё сыроват |
В основном это реализовано на достаточно скромном уровне. То есть сервисы анализируют совпадения цветов и яркостей соответствующих друг другу участков сравниваемых изображений или, например, взаимное расположение каждой пары точек объекта.
Как видите, даже в лимитированной базе фотографий сервисы работают не очень успешно. Хотя теоретически для фото можно было бы разработать систему, аналогичную по своей точности анализу отпечатков пальцев.
Однако для поисковика с неограниченным количеством индексируемых изображений это будет слишком дорого. А самое главное – долго: результатов выдачи в течение нескольких (в лучшем случае) минут не многие пользователи готовы дожидаться.
Ещё одним и даже более фундаментальным ограничением является сложность механизма зрительного восприятия человека. Основная проблема здесь – разрыв восприятия или так называемый семантический разрыв.
![]() |
![]() Сервис TeenEye предлагает найти похожие фото и изображения относительно указанного образца. На деле в ходе серии загрузок портретов известных людей мы получали одни и те же фото, отличающиеся лишь по размерности, яркости и чёткости, – порой на 20 страницах. |
Если перевести на обычный язык, это означает, что не всегда возможно сознательно сформулировать "правильный" текстовый запрос – по крайней мере, если речь идёт о поиске. Один пользователь, вводя слово "солнце", ожидает увидеть звезду в окружении планет, а другой – лужайку, голубое небо и много-много света.
Но в этой сложности и кроется значительный потенциал. Только представьте: вы только подумали о чём-то, родился в голове какой-то образ, мелькнула неясная мысль – и вы ищите соответствующую картинку. А уж дальше получаете необходимую информацию.
Впрочем, просто найти "желаемое" изображение, даже не абстрактное, а вполне конкретное, – тоже совсем неплохо.
В общем, интернет-поиск – это та область, где прогресс в буквальном смысле не стоит на месте.
Вполне возможно, что в ближайшем будущем можно будет совершенно спокойно отрефлексировать свой архетип, найдя единомышленников по картинкам из сновидений, или научиться наконец без проблем находить "то-не-знаю-что".
Не менее важна оценка имущества при разделе собственности. А вы как думали? Это важная составляющая любого бизнеса.