Инструменты поиска

Инструменты поиска и обработки информации могут существо­вать как отдельно от источников (например, общедоступные по­исковые машины или специальные программы), так и внутри баз данных. Встроенные инструменты позволяют работать только с содержимым базы, но зато результат этой работы отличается, как пра­вило, высокой четкостью.

Инструменты линейного поиска

Значительная группа поисковых инструментов предназначена для линейного поиска информации, т.е. для обнаружения в текстах (а именно с текстами работают поисковые машины, даже если поиск идет по базе видеосюжетов или фотографий) фрагментов, аналогич­ных заданному.

К таким инструментам относятся прежде всего общедоступные поисковые машины.

Среди поисковиков наибольшей популярностью в рунете поль­зуются Яндекс, Google и Рамблер. Мировой лидер Google в среднем дает больше ссылок на запрос, так как у него шире охват индекси­руемых страниц, но у Яндекса в целом выше релевантность.

Рамблер превосходит конкурентов по ценности как рейтинговая система, по­зволяющая осуществлять не только поиск информации, но и поиск источников с одновременной их оценкой — по тематике и степени их авторитетности, популярности.

Выбор поисковой машины — дело субъективное и определяется по результатам поиска опытным путем. При выборе следует внимательно изучить возможности расширенного поиска, который предлагают гло­бальные поисковые системы. Именно условия составления поисково­го запроса определяют степень «зашумленности» результата.

Составление запросов для систем линейного поиска

Работа с линейными поисковыми системами подразумевает оп­ределенные навыки в составлении запроса. Традиционные языки запросов подразумевают выбор ключевых слов, указание на их обяза­тельное наличие или отсутствие в текстах, положение ключевых слов относительно структуры текста (например, в заголовке или в самом теле документа) и относительно друг друга (расстояние между слова­ми, последовательность употребления, жесткость словосочетаний, нахождение внутри одного предложения, одного документа и пр.).

В профессиональных системах линейного, или универсального, поиска возможности дополнительных параметров значительно расши­рены. Например, в системе «Гарант» реализована уникальная техноло­гия поиска через «Энциклопедию ситуаций».

Пользователь формули­рует запрос, используя привычные ему термины, система «переводит» запрос и в течение нескольких минут предоставляет ответ. В «Интег-руме» реализованы следующие уникальные возможности — поиск с опечатками или вариантами написания, поиск по фамилии, имени, отчеству, когда умная система находит в текстах все формы употребле­ния фамилии, имени, отчества, которые могут соответствовать задан­ному, даже уменьшительные.

Например, если вы ищете человека с фамилией Александров и инициалами А.Ю., то, задав эти параметры при поиске с включением нужной функции, получите документы, где упоминается Шурик Александров, Алексей Юрьевич Александров, Антон Александров, Александров Автандил Юлианович, А. Александ­ров и т.д.

В материалах проекта «Гардарика» поисковикам рекомендуется составлять тезаурусы в зависимости от конкретных интересов и по­полнять их постоянно, по мере выявления новых терминов в ходе ра­боты. Более адекватной представляется структура тезауруса в виде се­мантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике).

Это весьма актуально для журнали­стов, работающих по одной теме, но прежде всего этот совет относится к пользователям общедоступных поисковых систем. Профессиональ­ные системы более специализированы и поэтому могут предложить пользователю готовые тезаурусы и типовые запросы.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)