Автор работы: Пользователь скрыл имя, 09 Января 2014 в 20:14, реферат
Когда человеку нужна информация, одним из первых встает вопрос, где и как её можно найти, и человек начинает свою навигационную деятельность в море информации. Часто он обращается в информационную службу.
Поисковое поведение имеет биологические корни, но в обществе навигационно-поисковые задачи - сложная часть человеческой деятельности, человеческой культуры.
1.3 Виды информационного поиска
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:
-Xcavator
-Retrievr
-PolarRose
-Picollator Online by Recogmission
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:
-Наличие у документа точного адреса
-Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.
Семантический поиск
Процесс поиска документов по их содержанию.
Условия:
-Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
-Составление поискового описания, в котором указывается дополнительное условие поиска.
Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания.
При семантическом
поиске находится множество
В этом принципиальное отличие каталогов и картотек.
Библиотека - собрание библиографических записей без указания адресов.
Документальный поиск
Процесс поиска в хранилище
информационно-поисковой
Два вида документального поиска:
Библиотечный, направленный на нахождение первичных документов.
Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Различают два вида:
Документально-
Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.
1.4 Информационный поиск как наука
Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.
ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.
Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.
В настоящее время ИП —
это бурно развивающаяся
Запрос и объект запроса
Говоря о системах ИП, употребляют термины запрос и объект запроса.
Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.
Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.
Задачи информационного поиска
Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.
Классическая задача ИП,
с которой началось развитие этой
области, — это поиск документов,
удовлетворяющих запросу, в рамках
некоторой статической
-Вопросы моделирования;
-Классификация документов;
-Фильтрация документов;
-Кластеризация документов;
-Проектирование архитектур поисковых систем и пользовательских интерфейсов
-Извлечение информации, в частности аннотирования и реферирования документов;
-Языки запросов и др.
Основные понятия поиска
Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы и экспертной системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.
Пертине́нтность (англ. pertinent) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).
Пертине́нтность (англ. pertinent) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользовател
Заключение
В процессе реализации информационного поиска следует руководствоваться рядом общих методических рекомендаций.
Несомненно, что характер
поиска всецело определяется содержанием
поставленной задачи. Формулирование
задачи поиска позволяет определить
область и особенности
Вначале поиск привязан к
теме и к цели детальной, всесторонней
разработки ее плана, когда особенно
необходим широкий охват
В самом общем виде процесс информационного поиска можно разделить на этапы формулирования задачи поиска, разработки рабочей программы поиска, реализации поиска и оформления его результатов.
И в заключение укажем, что, в любом случае, только при систематическом и целенаправленном изучении, знании и умении рационально применять систему информационного поиска современный специалист может быть уверен в эффективности и качестве своей работы.
Выбор источников информации,
стратегий ее поиска, методы оценки
полезности найденной информации –
все эти факторы являются характеристиками
информационного поведения
Таким образом, центральная задача информационного поиска – удовлетворить информационную потребность. Информационная потребность формулируются как некоторый запрос, представляющий собой набор ключевых слов, характеризующий то, что ищет пользователь.
Информационный запрос в широком смысле - текст, выражающий информационную потребность. Информационный запрос в узком смысле – входное сообщение в автоматизированную систему, содержащее требование на выдачу информации.
Поиск информации в новой информационной среде мы рассматриваем больше как процесс решения поисковой задачи, стоящей перед пользователем, нежели как просто нахождение релевантной запросу информации.
На сегодняшний день с развитием информационных и компьютерных технологий процесс поиска литературы значительно усовершенствован и по полноте получаемой информации и по времени поиска.
Интернет, международная система передачи данных, в частности Всемирная Паутина, дающая доступ к мультимедийной информации, оказали огромное воздействие на поиск источников информации. С ростом числа пользователей базами данных в них все чаще стали включать полнотекстовые материалы.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Гаврилова, Т.А. Базы
знаний интеллектуальных систем
/ Т.А. Гаврилова, В.Ф.
2. Рассел, С. Интеллектуальные системы / С. Рассел и др. – М.: Вильямс, 2007. – 1408 с.: ил.
3. Поисковики | машины поиска
| индексация // Режим доступа: http://www.
4. Поиск информации в
Интернете – Викиучебник // Режим
доступа: http://ru.wikibooks.org/wiki/