Главная
Новости
Статьи и обзоры
Горожанин
Обнинск в Internet
Web Design
Hardware
Software
Безопасность
Серфинг
Игродром
Relax
Технологии
Web-обзор
Интернет-ликбез
Опросник
УП-Технологии
ART.net
Ссылки
Архив
О нас
Контакты
Форумы
Основатель: К.Николаенко
Главный Редактор: С.Коротков
Web Design: Neutron
|
|
= Технология =
ЭФФЕКТИВНАЯ РАБОТА С ПОИСКОВЫМИ СЛУЖБАМИ
(с) Дмитрий Бардиян
Продолжение: начало в №9(197)
Смешивать осторожно
Далеко не все команды Google совместимы друг с другом. Есть команды-одиночки, которые никогда не желают работать в паре с другими. Одной из таких является link: (если помните, она отображает все страницы, которые ссылаются на указанный в параметрах URL). Представьте, как было бы удобно использовать эту команду совместно с site:, чтобы задавать ограничения еще и на домены. Скажем, разве не интересно узнать, из какой доменной зоны на ваш сайт чаще ссылаются - из .ru или из .net? Однако запрос вида link:mysite.com site:ru не произведет на Google должного эффекта, поскольку link работает только в одиночку. Как быть в такой ситуации? Обходные пути, естественно, найдутся (ведь недаром в разработке Google принимали участие русские специалисты!). Для интереса можно поэкспериментировать с такой комбинацией команд: inanchor:mysite.com -inurl:mysite.com. site:ru. В данном случае логика такова: сначала мы находим сайты, в описании ссылок которых встречается адрес нашей странички. Далее мы исключаемиз результата поиска сам mysite.com и его поддомены (если таковые имеются), а затем отбираем только те документы, которые принадлежат к доменной зоне .ru.
Разумеется, не рекомендуется озадачивать Google взаимоисключающими запросами вроде: site:linux.by -inurl:by либо happy (site:ru OR site:by).
После ряда испытаний хорошо себя проявили в совместной работе следующие команды: intitle:, site:, inurl:, filetype:. Проиллюстрируем их работу. Скажем, нас интересуют архивы электронных книг на английском языке. Составляем такой запрос: books intitle:"index of" inurl:ftp. В результате получим ссылки на весьма приличные FTP-архивы. Что касается запроса, то на человеческий язык его можно перевести так: нас интересуют страницы, где встречается слово books, заголовок должен содержать фразу index of (характерную для списка в FTP-архиве), а для того, чтобы быть уверенным, что мы имеем дело с FTP, URL должен содержать слово FTP.
Разбираем URL по косточкам
Вы когда-нибудь вглядывались в URL, который формирует Google во время поиска? Возьмем для примера следующий адрес: http://www.google.com/search?num=55&hl=en&q=upgrade+special
Рассмотрим по порядку, что все это значит.
num=55 - количество результатов на одной странице (может быть от 1 до 100). По умолчанию - 10, в нашем случае - 55.
hl=en - задает язык интерфейса Google. В данном случае это английский, но если мы изменим этот параметр на hl=ru, то все надписи в Google будут появляться на русском.
q=upgrade+special - это и есть сам запрос. К сожалению, ввести требования на русском языке непосредственно в адресной строке нормальный человек не в состоянии. Потому что выглядеть оно будет так: q=%D0%BA%D0%B0%D0%BA%D1%82%D1%83%D1%81. Перед вами было слово "кактус", если кто-нибудь не догадался. Однако в ряде случаев ручной ввод запроса по-русски крайне необходим. Например, если на вашем корпоративном ПК перeкрыт доступ к веб-сайтам, но работает электронная почта, и вы хотите пользоваться Google, отправляя запросы почтой на специальные службы вроде Web-to-mail, то небольшая хитрость позволяет легко обойти это ограничение. Просто сохраните себе на диск страничку Google и вводите нужное слово, открывая ее с локального диска - разумеется, при перекрытом доступе к Интернету результатов поиска вы не получите, но в адресной строке браузера высветится уже готовый URL с вашим запросом - копируйте его в почтовый клиент и отправляйте почтой.
Кроме того, вы смело можете добавить к URL еще несколько параметров:
as_qdr=m1 - указывает максимальный "возраст" найденной информации в месяцах. Значения могут варьироваться от 1 до 12.
safe=on - включает так называемый safe search, то есть систему фильтров, которая блокирует по большей части информацию сексуального характера.
Редактировать таким образом URL зачастую быстрее, чем менять параметры в настройках поиска.
Окончание следует.
|
|