Критерии эффективности информационного поиска

Автор работы: Пользователь скрыл имя, 15 Мая 2014 в 20:17, реферат

Краткое описание

Информационный поиск (information retrieval, data search) — процесс нахождения, отбора и выдачи определенной заранее заданными признаками информации (в том числе документов, их частей и/или данных) из массивов и записей любого вида.
В зависимости от степени привлечения к информационному поиску технических средств и участия в нем человека различают «ручной», «машинный» и «автоматизированный» информационный поиск.
Последний может производиться в режиме диалога или пакетной обработки запросов.

Содержание

Понятие информационного поиска………………………….3
Виды поиска……………………………………………..……4
Методы поиска………………………………………………..5
Критерии эффективности поиска……………………………6
Источники…………………………………………………….10

Вложенные файлы: 1 файл

Реферат.doc

— 71.00 Кб (Скачать файл)

 

ГБОУ ВПО

«СУРГУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Ханты-Мансийского автономного округа – Югры»

 


                                                                              

Кафедра теории физической культуры

 

 

 

 

 

 

 

 

 

 

                                                                              Реферат

 

На тему «критерии эффективности информационного поиска»

 

                                

 

 

 

 

 

 

 

 

 Выполнил: студент 205-31 гр.  1 курса

                                                                                             

                                                            Фамилия  Яковлев

                                                  Имя Евгений

                                                           Отчество Вячеславович

                                   

Проверил: преподаватель

Родионова  Марина Александрова

 

 

 

 

 

 

 

Сургут, 2014

 

 

 

 

 

 

 

                                                                           

 

Содержание

 

Понятие информационного поиска………………………….3

Виды поиска……………………………………………..……4

Методы поиска………………………………………………..5

Критерии эффективности поиска……………………………6

Источники…………………………………………………….10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Информационный поиск (information retrieval, data search) — процесс нахождения, отбора и выдачи определенной заранее заданными признаками информации (в том числе документов, их частей и/или данных) из массивов и записей любого вида. 
В зависимости от степени привлечения к информационному поиску технических средств и участия в нем человека различают «ручной», «машинный» и «автоматизированный» информационный поиск.  
Последний может производиться в режиме диалога или пакетной обработки запросов. 
Информационный поиск — научное направление, которое занимается принципами поиска неструктурированной документальной информации. В частности это относится к поиску информации в документах, поиск самих документов, извлечению метаданных из документов, поиску текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы. 
Поиск данных, поиск документов, информационный поиск и текстовый поиск являются самостоятельными направлениями информатики и обладают собственными методиками и практическим применением. Информационный поиск — междисциплинарная область, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, библиотечного дела.

 

 

 

 

 

 

 

 

 

 

 

                                             3

                                           

 

 

Виды поиска:

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являютсяинвертированные индексы.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose,Picollator и др.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                                                             4

 

Методы поиска:

Адресный поиск 
Процесс поиска документов по чисто формальным признакам, указанным в запросе. 
Для осуществления нужны следующие условия: 
Наличие у документа точного адреса 
Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы. 
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище. 
 
Семантический поиск 
Процесс поиска документов по их содержанию. 
Условия: 
Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса. 
Составление поискового описания, в котором указывается дополнительное условие поиска. 
Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске — с точки зрения содержания. 
При семантическом поиске находится множество документов без указания адресов. 
В этом принципиальное отличие каталогов и картотек. 
Библиотека — собрание библиографических записей без указания адресов. 
                

Документальный поиск 
Процесс поиска в хранилище информационно-поисковой системы первичных

документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска: 
Библиотечный, направленный на нахождение первичных документов. 
Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

 
Фактографический поиск 
Процесс поиска фактов, соответствующих информационному запросу. 
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения. 
Различают два вида: 
Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты. 
Фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

 

 

 

                                             5

 

 

 

 

 

Критерии эффективности информационного поиска

 

 

                                   Качество информационной системы

Качество информационной системы — это совокупность свойств системы, обусловливающих возможность ее использования для удовлетворения определенных в соответствии с ее назначением потребностей. Количественные характеристики этих свойств определяются показателями, которые необходимо контролировать и учитывать. Основными показателями качества информационных систем являются надежность, достоверность, безопасность (см. выше), эффективность. 

 

                                                     Надежность

Это- свойство системы сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения.

Надежность - важнейшая характеристика качества любой системы, поэтому разработана специальная теория - теория надежности. 

Теория надежности может быть определена как научная дисциплина, изучающая закономерности, которых следует придерживаться при разработке и эксплуатации систем для обеспечения оптимального уровня их надежности с минимальными затратами ресурсов.

Надежность - комплексное свойство системы; оно включает в себя более простые свойства, такие как безотказность, ремонтопригодность, долговечность и т д.

Безотказность - свойство системы сохранять работоспособное состояние в течение некоторого времени или наработки (наработка - продолжительность или объем работы системы).

Ремонтопригодность - свойство системы, заключающееся в приспособленности к предупреждению и обнаружению причин возникновения отказов, повреждений и поддержанию и восстановлению работоспособного состояния путем проведения  технического обслуживания и ремонтов.

Долговечность - свойство системы сохранять при установленной системе технического обслуживания и ремонта работоспособное состояние до наступления предельного состояния, то есть такого момента, когда дальнейшее использование системы по назначению недопустимо или нецелесообразно. 

Показатель надежности — это количественная характеристика одного или нескольких свойств, определяющих надежность системы. В основе большинства показателей надежности лежат оценки наработки системы, то есть продолжительности или объема работы, выполненной системой. Показатель надежности, относящийся к одному из свойств надежности, называется единичным. Комплексный показатель надежности характеризует несколько свойств, определяющих надежность системы.

На сегодняшний день разработано много конкретных практических способов повышения надежности информационных систем.

Для обеспечения надежности технических средств чаще всего выполняется:

1)      резервирование (дублирование) технических средств (компьютеров и их компонентов, сегментов сетей и т. д.);

2)      использование стандартных протоколов работы устройств ИС;

3)      применение специализированных технических средств защиты информации. 

 

Для обеспечения надежности функционирования программного комплекса ИС выполняется:

1)      тщательное тестирование программ, опытное исполнение программы с целью обнаружения в ней ошибок (обязательное условие эффективного тестирования - по крайней мере один раз выполнить все разветвления программы в каждом из возможных направлений);

2)      использование стандартных протоколов, интерфейсов, библиотек процедур, лицензионных программных продуктов;

3)      использование структурных методов для обеспечения надежной работы программных комплексов (иерархическое построение программ, разбиение программ на сравнительно независимые модули и т. д.);

4)      изоляция параллельно работающих процессов, в результате чего ошибки в работе  одной программы не влияют на работу операционной системы и других программ.  

 

Надежность информационных систем не самоцель, а средство обеспечения своевременной и достоверной информации на ее выходе. Поэтому показатель достоверности функционирования имеет для информационных систем главенствующее значение. 

 

                                                    Достоверность

Достоверность функционирования — свойство системы, обусловливающее безошибочность производимых ею преобразований информации. Достоверность функционирования информационной системы полностью определяется и измеряется достоверностью ее результатной информации.

Достоверность информации — это свойство информации отражать реально существующие объекты с необходимой точностью. Достоверность информации измеряется вероятностью того, что отражаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Одним из наиболее действенных средств обеспечения достоверности информации в ИС является ее контроль. Контроль — процесс получения и обработки информации с целью оценки соответствия фактического состояния объекта предъявляемым к нему требованиям и выработки соответствующего управляющего решения. 

Методы контроля достоверности информации, применяемые в ИС, весьма разнообразны. Классификация методов контроля может быть выполнена по большему числу признаков, в частности: по назначению, по уровню исследования информации, по способу реализации, по степени выявления и коррекции ошибок. 

 

1. Классификация методов  контроля достоверности по назначению

Профилактический контроль и одна из наиболее распространенных его  форм — тестовый контроль, предназначены для выявления состояния системы в целом и отдельных ее звеньев до включения системы в рабочийрежим. Целью профилактического контроля, осуществляемого часто в утяжеленном режиме работы системы, является выявление и прогнозирование неисправностей в ее работе с последующим их устранением.

Рабочий контроль, или контроль в рабочем режиме, выполняется в процессе выполнения системой возложенных на нее функций. Он, в свою очередь, может быть разделен на функциональный контроль и контроль качества продукции. Функциональный контроль может преследовать цель либо только проверки работоспособности (отсутствия неисправностей) системы, либо, кроме того, установления места и причины неисправности (диагностический контроль). Контроль качества продукции является контролем достоверности информации как одного из важнейших показателей качества продукции выпускаемой ИС.

Генезисный контроль проводится для выяснения технического состояния системы в прошлые моменты времени с целью определения причин сбоев и отказов системы, имевших место в прошлом; сбора статистических данных об ошибках, их характере, величине и последствиях (экономических потерях) этих ошибок для ИС.

Информация о работе Критерии эффективности информационного поиска