• Авторизация


22 секрета Google (Полезные tips'n'trics на каждый день); Язык запросов Google. 20-08-2008 14:25 к комментариям - к полной версии - понравилось!

Это цитата сообщения maslak Оригинальное сообщение

22 секрета Google (Полезные tips'n'trics на каждый день); Язык запросов Google.

Со стороны многое кажется предельно простым и понятным, любая проблема пустяковой, а задача решаемой. Но стоит взяться за дело самому, как тут же возникает куча подводных камней и всяческих непоняток. Вот взять хотя бы поиск в интернете: что может быть проще? Каждый может ввести в браузере www.google.com и воспользоваться прелестями поисковой системы, но почему-то найти то, что надо, удается далеко не всем. А все потому, что любой инструмент нужно использовать со знанием дела и подчас самый простой из них оказывается намного мощнее, чем все думают. Да тот же самый Google!Можно легко найти реферат по биологии, не особо заморачиваясь по поводу ключевых слов и не имея даже малейшего представления о модификаторах, кардинально влияющих на результаты поиска. Но если речь идет о чем-то специфическом, а времени на поиск катастрофически мало, забывать о тонкостях поисковой системы просто непростительно. Впрочем, хитрости поиска это далеко не все, о чем мы хотим рассказать тебе в этой статье.



Логическое "ИЛИ"
Первое, что нужно запомнить, принципы обработки ключевых слов. По умолчанию к каждому ключевому слову поисковая система применяет операцию логического "И".
Это значит, что на запрос "Хакер крутой журнал" Google выдаст
только те страницы, которые одновременно будут содержать и слово "Хакер", и
"крутой", и "журнал". Проблема в том, что далеко не всегда это является
обязательным условием. Если требуется найти страницы, включающие хотя бы одно из
слов, нужно поставить между ними оператор OR.
Пример: хакер крутой OR жалкий журнал


Точное совпадение

Сложные алгоритмы поиска Google учитывают морфологию языка,
различные особенности построения веб-документа и вовсе не предполагают, что
найденные страницы будут содержать в точности ту фразу, которая указана в строке
запроса. Слова могут быть разбросаны по всей странице и даже иметь другую форму,
что в большинстве случаев очень удобно. Но что если требуется именно точное
совпадение? Скажем, нужно найти текст песни по одной известной строке? В этом
случае надо заключить нужные слова в кавычки.
Пример: one of us


Плюсы важных слов

Чтобы сделать акцент на одно или несколько ключевых слов, поставь перед ними
знак "+". Это поможет системе понять, какие из ключевых слов наиболее важные, и
сформулировать результаты поиска более точно.
Пример: хакер +журнал


Убираем лишнее

Полученные результаты нередко засоряет какая-то лишняя информация. Чтобы не
тратить время на ее просмотр, советую наложить на результаты поиска фильтр.
Сделать это несложно. Надо лишь указать "слова-паразиты", поставив перед ними
знак "-" и включающие их страницы будут тут же исключены из результатов
поиска.
Пример: журнал хакер ламер


Поиск по конкретному сайту

Часто бывает ситуация, когда ты точно знаешь, что нужная информация есть на
конкретном сайте, но ты никак не можешь ее найти. Тут волей-неволей начинаешь
задумываться об эффективном поиске, но не встроенными средствами сайта (подчас
абсолютно бестолковыми), а мощными механизмам Google. И, в общем-то, проблемы в
этом нет, если взять на вооружение модификатор site:somesite.com.
Пример: В одном из номеров у нас был материал [Google-hackk. Его в момент
можно найти, набрав в Google [Google-hack
site:www.xakep.ruk.


Учитываем название документа

Намного большей эффективности поиска удается добиться, если с помощью
модификатора intitle указать слова, которые
обязательно должны входить в заголовок документа.
Пример: intitle:статьи site:www.xakep.ru


Знай конкурентов в лицо

Лучший способ найти дружественные (и конкурирующие) сайты спросить об этом
Google. В ответ на модификатор related: он с радостью выдаст сайты со схожей тематикой и контентом.
Пример: На запрос [related:www.xakep.ruk системы
выдаст линки на www.securitylab.ru, www.securityfocus.com и прочие проекты по информационной
безопасности.


Кто на нас ссылается?

Можно использовать Google и для того, чтобы проверить
популярность конкретного проекта. Так, модификатор
link: отобразит все страницы, которые ссылаются на этот
ресурс. Логика простая: чем их больше, тем ресурс популярнее.
Пример: link:www.xakep.ru


Используй синонимы

Google знает, что такое синонимы! Если хочешь, чтобы в результаты вошли
страницы не только с конкретным указанным словом, но и c его синонимами, поставь
перед ним знак [~k.
Пример: ipod ~hacking


Как найти конкретный тип документа

Если ты ищешь конкретный тип документа, не стесняйся сказать об этом
Google. Будь это обычная страница, презентация, PDF или
что-либо еще можно найти все что угодно, при помощи модификатора filetype:.

Пример: SQL-injection filetype:pdf. В ответ
система выдаст ссылки на PDF-документы по SQL-injection.


Не забывай про числовые диапазоны

Редко используемый, но реально полезный прием. Возьми на вооружение
модификатор [X..Yk, позволяющий указать числовой диапазон. Ситуаций, когда такие
ухищрения могут понадобиться, масса!
Пример: хакер 2000..2002


Быстрый калькулятор

Для выполнения громоздких вычислений совсем не обязательно елозить мышкой и
тыкать кнопки в глупом Windows-калькуляторе. Просто введи математическое
выражение (с любым количеством действий и скобок) в Google и
тот быстро все посчитает. Более того, поисковик можно использовать как удобный
конвертер валют!
Пример 1: (31337-3.14)/87
Пример 2: 600 USD in RUR


Словарь терминов

Чтобы быстро найти определения какого-либо термина, используется модификатор
define:. Тот же самый результат ты получишь, если перед словом поставишь
человеческие фразы [what isk или [что такоеk.
Пример: define:LDAP


Просмотрщик умерших сайтов

Бывает, обратишься на сайт, а он в дауне. Что делать? Не один раз в подобной
ситуации меня выручал кэш Google, в котором хранится огромное
количество документов. Действовать нужно так: сначала набираешь нужный URL в
строке запроса, а потом кликаешь [Сохранено в кэшеk на странице
результатов. Вуаля!


Переведи любую страницу

Мало кто знает о существовании замечательного сервиса для перевода
веб-страниц translate.google.com. Это был бы еще один ресурс для
банального перевода иностранного контента, если бы свою руку к нему не приложил
Google. Нет, он не будет обрабатывать тексты как
профессионал-переводчик. Но зато в случае проблем даст пользователю возможность
разобраться со смыслом фразы или предложения самому. Переведенная страница как
обычно выводится на экран, но юзер всегда может навести мышку на сомнительный
отрывок и с помощью всплывающей подсказки узнать, как фраза звучала в оригинале.



Вспомогательный прокси-сервер

Привыкшим к безлимитному интернету и всеобщей дозволенности по части контента
бывает очень обидно сталкиваться с серьезными ограничениями корпоративных
прокси-серверов. В той же самой школе или университете. Если администратор
фильтрует запросы по черному списку, в который входят запретные домены, это
легко обходится с помощью следующего запроса переводчику
Google:

www.google.com/translate?langpair=ru|ru&u=www.xakep.ru
Тогда браузер будет обращаться к поисковой системе, которая в 99% случаев не
заблокирована, и уже через нее получать нужный контент. Указанная в параметрах
пара языков [ru|ruk говорит о том, что переводить содержимое нужно с русского на
русский, то есть фактически оставить все без изменений. Само собой, вместо
русского можно использовать любой другой язык.


Почти 3 Гб для хранения файлов

Ты уже успел оценить функциональность и продуманность почтового сервиса
Google Mail (www.gmail.com)? Тогда тебе определенно стоит попробовать еще
одну дополнительную феньку - GMail Drive (www.viksoe.dk/code/gmail.htm). В то время как Google выделяет
на каждый email-аккаунт более 2 Гб дискового пространства, Gmail
Drive позволяет использовать его как свой собственный диск. После
установки проги, в системе появляется еще один диск, который полностью
аналогичен всем остальным. Разница лишь в том, что его файлы физически хранятся
в интернете.


Онлайн-фотоальбом

С помощью бесплатного аккаунта на picasaweb.google.com можно выложить в инет 1 Гб фотографий.
Очень неплохо для сервиса, который позволяет не только удобно закачивать, но и в
офигенной форме просматривать изображения. Еще одна разработка от
Google оффлайн-программа Picasa поможет
быстро найти, отредактировать и залить в инет фотографии с твоего винта. Каждый
раз при запуске Picasa автоматически определяет местоположение
фотографий (даже тех, о которых ты забыл) и организует их по визуальным
альбомам. А чтобы залить нужные фотки в инет, потребуется лишь пару раз кликнуть
мышкой.


Взломщик интернета

Тебе, наверняка, не надо рассказывать, что Google это
идеальное средство для массового поиска уязвимых сценарий. Во всех красках этот
процесс описал Форб в статье [Google-hack для маленькихk (www.xakep.ru/magazine/xa/076/056/1.asp). Однако получив пару
тысяч страниц с результатами поиска, не спеши сразу кидаться в бой.
Просматривать эти километровые страницы с огромным количеством ненужной
информации занятие довольно утомительное. Зато с помощью таких утилит, как
uf0_google или googler, можно вытащить из них только то, что требуется,
ссылки. А дальше ты волен делать что хочешь: либо обрабатывать их вручную, либо
скормить самописному скрипту или программе, которая все будет делать за тебя.
Кстати говоря, по адресу http://johnny.ihackstuff.com/index.php?module=prodreviews
собрана огромная коллекция запросов, с помощью которых ты сможешь искать дырявые
скрипты. Думаю, она тебе пригодится :).


Быстро ищем музыку

Используя различные модификаторы, можно довольно хорошо приспособить
Google для поиска музыки. Причем особенно успешные результаты
достигаются, когда поиск осуществляется по листингам открытых директорий, то
есть папок, в которых нет htm-документов для отображения, но навалена куча
файлов. Сами листинги можно искать по ключевым словам [index ofk, [last
modifiedk, [parent ofk в названии (тэг ) документа (с помощью
модификатора intitle), исполнителя или песню по точному совпадению (достаточно
взять их в кавычки). Остается лишь задать наличие на странице одного из
музыкальных расширений (mp3|wma|ogg) и исключить из результатов поиска все
динамические и статические страницы (нам нужны только листинги, составленные
веб-сервером). В конечном итоге запрос будет выглядеть примерно так:

"index of" + "mp3" + "radiohead" -html -htm php
Подробный мануал ты найдешь на сайте www.geocities.com/my_haz_runs. Но чтобы не заморачиваться,
рекомендую уже готовый инструмент: www.g2p.org быстро составит необходимый запрос и поможет найти
нужные композиции.


Останови шпионов!

Google Analytics (www.google.com/analytics) это специальный сервис от Google,
который помогает веб-мастерам анализировать поток посетителей их сайта. С
помощью специального JavaScript-сценария и кукисов он записывает самую
разнообразную информацию о посетителе, включая его IP-адрес. Потом по этой
информации можно отследить очень много вещей, что, естественно, нас не
устраивает. Поэтому, пожалуй, оставим этот сервис не у дел, добавив в host-файл
компьютера запись:

127.0.0.1 www.google-analytics.com


Firefox и Google

Кажется, что Google выдает результаты в наиболее удобном
виде? Ошибаешься, с помощью плагина CustomizeGoogle для
Firefox (www.customizegoogle.com) реально сделать работу с поисковой
системой еще более комфортной! Хочешь убрать надоедливую рекламу? Эта и еще
десяток функций - к твоим услугам. Рекомендую также последнее нововведение
опцию Stream Google search result pages, которая фоном
подгружает результаты поиска с других страниц и склеивает с той, что ты
просматриваешь в текущий момент.


В июле 2006 года Oxford English Dictionary, являющийся
одним из самых авторитетных словарей английской языка, добавил в свое последнее
издание слово [Googlek в значении [искать информацию в
интернетеk. Так [Googlek официально стало английским словом.
Google искаженное написание английского слова [googolk
([гуголk), используемого для обозначения числа, состоящего из единицы и ста
нулей.
Google ежедневно регистрирует около 50 миллионов поисковых
запросов и индексирует более 8 миллиардов веб-страниц.


Источник Хакер, номер #101
Предыдущая похожая новость на SFW (но меньшая по объему): Язык запросов Google



Язык запросов Google.

На
данный момент Google занимает более 70 % мирового рынка, а значит, семь
из десяти находящихся в сети людей обращаются к его странице в поисках
информации в интернете. Cейчас Google регистрирует ежедневно около 50
млн поисковых запросов и индексирует более 8 миллиардов веб-страниц.
Google может находить информацию на 101 языке. Google на конец августа
2004 года состояла из 132 тыс. машин, расположенных в разных точках
планеты (из Википедии).

Интерфейс Google содержит довольно
сложный язык запросов, позволяющий ограничить область поиска отдельными
доменами, языками, типами файлов и т. д. На языке запросов я и хочу
остановиться подробнее.

Основные нужные в работе операторы языка запросов:

site:

Ограничение поиска сайтом или доменом

Пример: google site:www.egorych.com ищет слово google на этом блоге

сache:

Возвращает страницу, сохраненную в кэше гугла

Пример: cache:www.egorych.com

link:

По
идее должен выдавать страницы, которые ссылаются на указанную страницу.
На самом деле выдает хорошо если десятую часть проиндексированных
обратных ссылок. Поэтому смотреть обратки нужно либо в центре
вебмастеров Google, либо в Yahoo! (например таким запросом:
linkdomain:site.com -site:site.com).

Пример: link:mail.ru
Результат - 13 000 ссылок. По запросу в Yahoo! обраток больше 40 000
000. Ссылки по запросу link: появляются обычно через пару месяцев после
индексации и обычно с хороших, весомых страниц с высоким PageRankом.
Короче для анализа продвижения сайта запрос link: подходит слабо.

allinurl:

Находит страницы, в URL которых содержатся все ключевые слова.

Пример:
allinurl:buy phentermine - по этому запросу находим множество доров, в
названии страниц которых встречаются заданные ключевики.

inurl:

Похоже
на предыдущий оператор, но теперь в выдаче будут страницы, в URL
которых содержатся ключевые слова (в любом порядке, в любом
количестве). Посмотрите выдачу, и увидите разницу.

Пример: inurl:buy phentermine

inanchor:

Ищет ключевые слова в анкорах (тексте) ссылок

Пример: adsense inanchor:blog

allintitle:

Находит
страницы, в заголовках которых есть все ключевые слова. Наличие
ключевого слова в теге важно для продвижения, поэтому с помощью такого
запроса можно анализировать конкуренцию и находить контент, например
для сплогов.

Пример: allintitle:insurance - 9 590 000 страниц,
PR страниц из первой десятки - от 5 до 7. Короче, по страхованию ниша
очень конкурентна.

intitle:

То же самое, только больше вольности в расположении ключевых слов.

Пример: intitle:coft tabs

allintext:

Поиск страниц с ключевыми словами в теле документа. Не работает в сочетании с другими операторами.
Пример: allintext:как настроить веб сервер

filetype:

Находит файлы определенного типа

Пример: filetype:swf

:

Ищет информацию по регионам

Пример: yandex+:ru

related:

Находит похожие или тематически связанные сайты. Можно таким образом искать тематичные сайты для продвижения
Пример: related:yandex.ru. Вот они, поисковики

info:

Интерфейс для нескольких операторов. Показывает информацию о странице
Пример: info:yandex.ru

define, what is, what are

Находит определение ключевой фразы

Пример: what is search engine. Что такое поисковая система?

________________________________________________________________...

В
принципе для работы этого достаточно. Есть еще и другие операторы
googlea, например movie:, book: (поиск фильмов и книг). Обычно
оперируют приведенными операторами и добиваются нужных запросов
комбинируя простые запросы.

Например вот так: site:yandex.ru+intitle:спам

Из простых операторов можно составить практически любой нужный запрос.

Кстати
много полезных операторов зашиты в гугловский тулбар для FireFox.
Pagerank, обратные ссылки, кэш, похожие страницы и многое другое.

Сообщение добавлено через MovableType API

вверх^ к полной версии понравилось! в evernote


Вы сейчас не можете прокомментировать это сообщение.

Дневник 22 секрета Google (Полезные tips'n'trics на каждый день); Язык запросов Google. | mashuk007 - Дневник mashuk007-мой цитатник | Лента друзей mashuk007 / Полная версия Добавить в друзья Страницы: раньше»