Современные информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 13 Октября 2014 в 13:34, реферат

Краткое описание

Актуальность. Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
Проблема поиска и сбора информации - одна из важнейших проблем информационно поисковых систем. Конечно, нельзя сравнивать в этом отношении, скажем, средние века, когда поиск информации был проблемой потому, что этой информации было мало, и требовались усилия только для того, чтобы найти хоть что-то по более или менее значительному интересующему вопросу.

Содержание

Введение
Глава 1. Информационно-поисковые системы
1.1 Понятие информационно-поисковых систем…………………….……..4
1.2 История развития ИПС……………………………………………….….6
1.3 Структура ИПС…………………………………………………….……..7
1.4 Виды ИПС………………………………………………………………...9
Глава 2. Современные информационно-поисковые системы
2.1 Сферы использования современных ИПС………………………..…...11
2.2 Архитектура современных ИПС……………………………………….12
2.3 Популярные ИПС…………………………………………………….....14
Заключение
Список использованной литературы

Вложенные файлы: 1 файл

информационно поисковые системы (2).docx

— 41.62 Кб (Скачать файл)

При работе с дескрипторами индексируемые документы переводятся на некоторый дексрипторный информационный язык. Дескрипторный информационный язык, как и любой другой язык, состоит из алфавита (символов), слов, средств выражения парадигматических и синтагматических отношений между словами. Парадигматика предусматривает выявление скрытых в естественном языке лексико- семантических отношений между понятиями. [11, c. 44] В рамках парадигматических отношений можно рассматривать, например, синонимию, омонимию. Синтагматика исследует такие отношения между словами, которые позволяют объединять их в словосочетания и предложения. Синтагматика включает правила построения слов из элементов алфавита (кодирование лексических единиц), правила построения предложений (текстов) из лексических единиц (грамматика). [15]

То есть, запрос пользователя переводится в дескрипторы и обрабатывается ИПС уже в этой форме. Такой подход более затратен по вычислительным ресурсам, но и потенциально более продуктивен, так как позволяет отказаться от критерия релевантности и работать непосредственно с пертинентностью документов. [3, c. 121]

Ранжирование результатов поиска

Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже просто просмотреть такие списки невозможно, да и не нужно. Было бы удобно иметь возможность задать формальные критерии (хотя бы относительной) важности (с точки зрения пертинентности) документов с тем, чтобы наиболее важные документы попадали бы в начало списка. Все ИПС в настоящее время уделяют основное внимание именно алгоритму ранжирования полученных ссылок. [10, c. 122]

Наиболее часто используемыми критериями при ранжировании в ИПС являются наличие слов из запроса в документе, их количество, близость к началу документа, близость к друг другу;

Наличие слов из запроса в заголовках и подзаголовках документов (заголовки должны быть специально отформатированы);

Количество ссылок на данный документ с других документов; «рекспектабельность» ссылающихся документов. [10, c. 123]

 

Глава 2. Современные ИПС

2.1 Сферы использования  современных ИПС

Современные ИПС характерны для так называемой информационной индустрии -- новейшей области экономики и социальной сферы, занятой обработкой, систематизацией, накоплением и распространением информации. Бурное развитие ИПС связано с успехами информатики (Информатика). Предметами запроса в ИПС могут быть библиографические данные, управленческая и фактографическая информация, экспертные оценки, ретроспективный опыт, результаты исследования моделей и т.д. Такой широкий круг задач обусловливает большое разнообразие типов ИПС. Они различаются своими целями, объемом содержащихся сведений, видами информации, способами доведения ее до потребителя. [2, c. 14] Наряду с локальными ИПС, действующими в рамках одного учреждения (например, поликлиники или больницы), существуют национальные и интернациональные центры информационного обслуживания (например, в области охраны окружающей среды). Широкое распространение получили библиографические ИПС (например, содержащие библиографию по всем областям медицины и медико-биологических наук). Массовое производство персональных ЭВМ, развитие средств коммуникаций, возможность объединения ЭВМ в информационные сети и обращения со своего рабочего места к сведениям, находящимся в памяти других ЭВМ, существенно расширили диапазон применения информации, широту и глубину ее поиска. Качественно новый этап развития ИПС связан с формированием баз данных на машиночитаемых носителях. Такие базы данных позволяют обращаться к ним дистанционно, одновременно по многим запросам, получая результаты поиска оперативно и в удобном виде. [2, c. 15]

Медицина и здравоохранение являются чрезвычайно специфической областью внедрения ИПС. Это связано со сложной структурой и многообразием форм медико-санитарной информации, которая включает трудно формализуемые понятия и категории, а также значительные массивы подлежащих учету данных. Особенностью медицинской информации является и то, что результаты единичных клинических или экспериментальных наблюдений по мере накопления и обобщения становятся основой для осуществления крупных здравоохранительных и социальных мероприятий. Медико-санитарная информация является базой принятия управленческих решений -- от выбора наиболее важных направлений научно-исследовательской работы до проведения экстренных санитарно-профилактических мероприятий. В массивы информации, на основании анализа которой осуществляется управление здравоохранением, входят статистика (демографическая и популяционная, статистика кадров, данные о заболеваемости и смертности и пр.), обобщенные данные о состоянии и достижениях медицинской и ряда смежных научных дисциплин, опыт предшествующих лет. Именно комплексный характер сведений послужил причиной разработки единой концепции ИПС. Она включает поэтапное создание отдельных подсистем, объединение которых достигается как на уровне обмена базами данных, так и (или) с помощью средств коммуникаций. [9, c. 50]

Процесс разработки и интеграции подсистем в ИПС может осуществляться по вертикали и по горизонтали по мере их создания. Подсистемы, являющиеся вспомогательными (например, учет и движение кадров, планирование и финансирование), могут создаваться независимо от других. На нижнем уровне учреждения здравоохранения (больницы, клиники, НИИ) пользуются ИПС для ведения историй болезни, контроля эффективности лечебных мероприятий, сбора и обработки первичных статистических данных, а также для решения управленческих задач своего уровня компетенции (использование коечного фонда и лабораторно-диагностического оборудования, лекарственное обеспечение и др.). Осуществляя оперативные функции, эти ИПС одновременно накапливают, а затем передают необходимую информацию на более высокий уровень (городской, областной). Отдельно создаются подсистемы справочно-информационного обслуживания (в области библиографии и научных исследований, нормативных материалов, стандартов). В рамках общей ИПС могут разрабатываться подсистемы для поддержки и развития отдельных служб (например, психиатрической, онкологической) или целевых программ (например, побочное действие лекарственных препаратов). [1, c. 60]

2.2 Архитектура современных  ИПС для WWW

Прежде чем описать проблемы построения информационно-поисковых систем Web и пути их решения рассмотрим типовую схему такой системы (рис. 2). [13]

Рисунок 2. Типовая схема информационно-поисковой системы.

Client (клиент) на этой схеме - это программа просмотра конкретного  информационного ресурса. Наиболее  популярны сегодня мультипротокольные  программы типа Netscape Navigator. Такая  программа обеспечивает просмотр  документов WWW, Gopher, Wais, FTP-архивов, почтовых  списков рассылки и групп новостей Usenet. В свою очередь все эти  информационные ресурсы являются  объектом поиска информационно-поисковой  системы.

User interface (пользовательский  интерфейс) - это не просто программа  просмотра, в случае информационно-поисковой  системы под этим словосочетанием  понимают также способ общения  пользователя с поисковым аппаратом: системой формирования запросов и просмотров результатов поиска.

Search engine (поисковая машина) - служит для трансляции запроса  на информационно-поисковом языке (ИПЯ), в формальный запрос системы, поиска ссылок на информационные  ресурсы Сети и выдачи результатов  этого поиска пользователю.

Index database (индекс базы данных) - индекс, который является основным  массивом данных ИПС и служит  для поиска адреса информационного  ресурса. Архитектура индекса устроена  таким образом, чтобы поиск происходил  максимально быстро и при этом  можно было бы оценить ценность  каждого из найденных информационных  ресурсов сети.

Queries (запросы пользователя) - сохраняются в его (пользователя) личной базе данных. На отладку  каждого запроса уходит достаточно  много времени, и поэтому чрезвычайно  важно запоминать запросы, на  которые система дает хорошие  ответы.

Index robot (робот- индексировщик) - служит для сканирования Internet и  поддержания базы данных индекса  в актуальном состоянии. Эта программа  является основным источником  информации о состоянии информационных  ресурсов сети.

WWW sites - это весь Internet или  точнее - информационные ресурсы, просмотр  которых обеспечивается программами  просмотра. [3, c. 200]

 

2.3 Популярные поисковые  системы

Согласно данным LiveInternet об охвате русскоязычных поисковых запросов на 2013 год :

Всеязычные:

Google (37,2 %)

Bing (0,8 %)

Yahoo! (0,2 %) и принадлежащие  этой компании поисковые машины:

Inktomi

AltaVista

Alltheweb

Англоязычные и международные:

AskJeeves (механизм Teoma)

Русскоязычные -- большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках -- украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами. [8, c. 99]

Яндекс (48,1 %)

Mail.ru (5,9 %)

Рамблер (1,2 %)

Нигма (0,3 %)

Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков. [7, c. 100]

 

                                                Заключение

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

1. простота в использовании

2. чётко организованный  и обновляемый индекс.

3. быстрый поиск в базе  данных и быстрое реагирование.

4. надёжность и точность  результатов поиска.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

 

Список использованной литературы

1. Ашманов, И. С. Продвижение  сайта в поисковых системах / И. С. Ашманов. - М. : «Вильямс», 2007. - 304 с.

2. Байков, В. Д. Интернет. Поиск  информации. Продвижение сайтов / В. Д. Байков. - СПб.: БХВ- Петербург, 2000. -- 288 с.

3.Гаврилов, А. В. Локальные  сети ЭВМ / А. В. Гаврилов.- М. : «Мир», 1990.- 154 с.

4. Гайдамакин, Н. А. Автоматизированные  информационные системы, базы и  банки данных / Н. А. Гайдамакин.- М. : «Гелиос», 2002.- 280 с.

5. Кадеев, Д. Н. Информационные  технологии и электронные коммуникации / Д. Н. Кадеев.- М.: «Электро», 2005.- 250 с.

6. Колисниченко, Д. Н. Поисковые  системы и продвижение сайтов  в Интернете / Д. Н. Колисниченко. - М. : «Диалектика», 2007. - 272 с.

7. Ландэ, Д. В. Поиск знаний  в Internet / Д. В. Ландэ. - М. : «Диалектика», 2005. -- 272 с.

8. Маннинг, К. Введение в  информационный поиск / К. Маннинг. - М.: «Вильямс», 2011.- 200 с.

9. Чурсин, Н. А. Популярная  информатика / Н. А. Чурсин.- М.: «Вильямс», 2007.- 300 с.

10. Якубайтис, Э. А. Информатика- электроника- сети / Э. А. Якубайтис.- М.: «Финансы и статистика», 1989.- 300 с.

 

 

 


Информация о работе Современные информационно-поисковые системы