Виды информационного поиска

Автор работы: Пользователь скрыл имя, 09 Января 2014 в 20:14, реферат

Краткое описание

Когда человеку нужна информация, одним из первых встает вопрос, где и как её можно найти, и человек начинает свою навигационную деятельность в море информации. Часто он обращается в информационную службу.
Поисковое поведение имеет биологические корни, но в обществе навигационно-поисковые задачи - сложная часть человеческой деятельности, человеческой культуры.

Вложенные файлы: 1 файл

реферат.docx

— 38.48 Кб (Скачать файл)

 

1.3 Виды информационного  поиска

Полнотекстовый  поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

-Xcavator

-Retrievr

-PolarRose

-Picollator Online by Recogmission

Адресный  поиск

Процесс поиска документов по чисто формальным признакам, указанным  в запросе.

 Для осуществления нужны следующие условия:

-Наличие у документа точного адреса

-Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.

Адресами документов могут  выступать адреса веб-серверов и  веб-страниц и элементы библиографической  записи, и адреса хранения документов в хранилище.

Семантический поиск

Процесс поиска документов по их содержанию.

 Условия:

-Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.

-Составление поискового описания, в котором указывается дополнительное условие поиска.

 

Принципиальная разница  между адресным и семантическим  поисками состоит в том, что при  адресном поиске документ рассматривается  как объект с точки зрения формы, а при семантическом поиске - с  точки зрения содержания.

 При семантическом  поиске находится множество документов  без указания адресов.

 В этом принципиальное  отличие каталогов и картотек.

 Библиотека - собрание библиографических записей без указания адресов.

Документальный  поиск

Процесс поиска в хранилище  информационно-поисковой системы  первичных документов или в базе данных вторичных документов, соответствующих  запросу пользователя.

Два вида документального  поиска:

Библиотечный, направленный на нахождение первичных документов.

Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Фактографический  поиск

Процесс поиска фактов, соответствующих  информационному запросу.

 К фактографическим  данным относятся сведения, извлеченные  из документов, как первичных,  так и вторичных и получаемые  непосредственно из источников  их возникновения.

Различают два  вида:

Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.

Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

 

1.4 Информационный поиск как наука

Информационный поиск  — большая междисциплинарная  область науки, стоящая на пересечении  когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

ИП рассматривает поиск  информации в документах, поиск самих  документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных  реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.

Существует некоторая  путаница, связанная с понятиями  поиска данных, поиска документов, информационного  поиска и текстового поиска. Тем  не менее, каждое из этих направлений  исследования обладает собственными методиками, практическими наработками и  литературой.

В настоящее время ИП —  это бурно развивающаяся область  науки, популярность которой обусловлено  экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и  множество конференций. Одной из наиболее известных является TREC, организованной в 1992 Министерством обороны США  совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.

Запрос и объект запроса

Говоря о системах ИП, употребляют термины запрос и  объект запроса.

Запрос  — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект  запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.

Задачи информационного  поиска

Центральная задача ИП —  помочь пользователю удовлетворить  его информационную потребность. Так  как описать информационные потребности  пользователя технически непросто, они  формулируются как некоторый  запрос, представляющий из себя набор  ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции  документов. Но список задач ИП постоянно  расширяется и теперь включает:

-Вопросы моделирования;

-Классификация документов;

-Фильтрация документов;

-Кластеризация документов;

-Проектирование архитектур поисковых систем и пользовательских интерфейсов

-Извлечение информации, в частности аннотирования и реферирования документов;

-Языки запросов и др.

Основные  понятия поиска

Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы и экспертной системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Пертине́нтность (англ. pertinent) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользовател

Заключение

В процессе реализации информационного  поиска следует руководствоваться  рядом общих методических рекомендаций.

Несомненно, что характер поиска всецело определяется содержанием  поставленной задачи. Формулирование задачи поиска позволяет определить область и особенности используемых источников, облегчить составление  программы поиска.

Вначале поиск привязан к  теме и к цели детальной, всесторонней разработки ее плана, когда особенно необходим широкий охват источников. Затем информационный поиск конкретизируется, ограничивается непосредственным содержанием  задачи.

В самом общем виде процесс  информационного поиска можно разделить  на этапы формулирования задачи поиска, разработки рабочей программы поиска, реализации поиска и оформления его  результатов.

И в заключение укажем, что, в любом случае, только при систематическом  и целенаправленном изучении, знании и умении рационально применять  систему информационного поиска современный специалист может быть уверен в эффективности и качестве своей работы.

Выбор источников информации, стратегий ее поиска, методы оценки полезности найденной информации –  все эти факторы являются характеристиками информационного поведения человека. Критериями информационной культуры человека можно считать его умение адекватно  формулировать свою потребность  в информации во всей совокупности информационных ресурсов, перерабатывать информацию и создавать качественно  новую, вести индивидуальные информационно-поисковые  системы, адекватно отбирать и оценивать  информацию.

Таким образом, центральная  задача информационного поиска –  удовлетворить информационную потребность. Информационная потребность формулируются  как некоторый запрос, представляющий собой набор ключевых слов, характеризующий  то, что ищет пользователь.

Информационный запрос в  широком смысле - текст, выражающий информационную потребность. Информационный запрос в узком смысле – входное  сообщение в автоматизированную систему, содержащее требование на выдачу информации.

Поиск информации в новой  информационной среде мы рассматриваем  больше как процесс решения поисковой  задачи, стоящей перед пользователем, нежели как просто нахождение релевантной  запросу информации.

На сегодняшний день с  развитием информационных и компьютерных технологий процесс поиска литературы значительно усовершенствован и  по полноте получаемой информации и  по времени поиска.

Интернет, международная  система передачи данных, в частности  Всемирная Паутина, дающая доступ к  мультимедийной информации, оказали  огромное воздействие на поиск источников информации. С ростом числа пользователей базами данных в них все чаще стали включать полнотекстовые материалы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Гаврилова, Т.А. Базы  знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский  – СПб.: Питер, 2001. – 384 с.: ил.

2. Рассел, С. Интеллектуальные  системы / С. Рассел и др. –  М.: Вильямс, 2007. – 1408 с.: ил.

3. Поисковики | машины поиска | индексация // Режим доступа: http://www.novice.ws/search.htm

4. Поиск информации в  Интернете – Викиучебник // Режим доступа: http://ru.wikibooks.org/wiki/Поиск_информации_в_Интернете

 

 


Информация о работе Виды информационного поиска