Особенности построения правовых информационно-поисковых систем

Автор работы: Пользователь скрыл имя, 01 Декабря 2013 в 00:07, реферат

Краткое описание

В правовой сфере развит устойчивый интерес к информационно- поисковым системам. Это прежде всего фактографические системы по законодательным и нормативным актам. Как инструмент законотворчества представляют также интерес базы знаний. Типовыми неавтоматизированными информационными системами являются библиотечные, промышленные, патентные каталоги, каталоги стандартов, словари, справочники, энциклопедии. Опыт работы с этими информационными объектами помогает при проведении аналогий. В этих системах в качестве поискового критерия используются поиск по индексу рубрики, лексикографический (алфавитный) поиск, поиск по ключевым словам в наименовании или в тексте документа.

Вложенные файлы: 1 файл

Реферат информационно-поисковые правовые системыС.doc

— 455.50 Кб (Скачать файл)

 

 

 

 

 

 

 

Реферат

 

Особенности построения правовых информационно-поисковых  систем  
ОГЛАВЛЕНИЕ

 

 

ВВЕДЕНИЕ

Внедрение информационных технологий в различные сферы  деятельности определяет специальные  требования к структуре информации для обеспечения удобства работы с ней и облегчения ее поиска.

Существенную  помощь в поиске оказывают автоматизированные системы. В качестве поисковых атрибутов могут быть использованы как типовые поисковые атрибуты, использовавшиеся для неавтоматизированного варианта поиска, так и специальные, возможность применения которых предоставляют именно компьютеризированные системы, что прежде всего связано с объемами обработки поисковой информации.

В правовой сфере  развит устойчивый интерес к информационно- поисковым системам. Это прежде всего фактографические системы по законодательным и нормативным актам. Как инструмент законотворчества представляют также интерес базы знаний. Типовыми неавтоматизированными информационными системами являются библиотечные, промышленные, патентные каталоги, каталоги стандартов, словари, справочники, энциклопедии. Опыт работы с этими информационными объектами помогает при проведении аналогий. В этих системах в качестве поискового критерия используются поиск по индексу рубрики, лексикографический (алфавитный) поиск, поиск по ключевым словам в наименовании или в тексте документа.

Постоянно возрастающее количество правовых документов, динамизм их обновления, недостаточная согласованность отдельных правовых актов определяют потребность практического использования информационно-поисковых систем (ИПС). Можно выделить правовые ИПС по законодательству, по классификации правовых норм и прецедентов в отдельных приложениях (например, экономических, гражданских, уголовно-процессуальных) и др.

Особое место  среди правовых ИПС отводится  справочным системам по законодательным и основным распорядительным государственным актам. Учитывая количество таких актов, отдельные системы (при одинаковых принципах построения) имеют специализированные наполнения, которые ориентированы на определенную предметную область. Повышенным вниманием в последнее время пользуется финансовая, в частности банковская, сфера.

 

Глава 1 Особенности построения правовых информационно-поисковых систем

В базы информационно-поисковых систем включаются официальные документы уполномоченных органов власти и управления РФ, которые устанавливают, изменяют или отменяют нормы права. Помимо этого в базы данных включаются неоднократно принимаемые нормативные акты, носящие преимущественно общий характер и направленные на регулирование определенного вида общественных отношений.

1.1 Структура правовых ИПС

Практически каждый подобный комплекс содержит две сопряженные между собой базы данных.

Первая включает аннотированную информацию о принятых нормативных актах в виде картотеки, а также о практике их применения. Вторая база данных содержит полномасштабные тексты нормативных актов, документов, комментариев и т.п

 

 

1.2 Режимы поиска информации

Как правило, развитые правовые информационные системы предоставляют возможность поиска необходимой информации в трех основных режимах.

1. Контекстный поиск. Предусматривает возможность поиска любых понятий, содержащихся в нормативном документе в любом логическом их сочетании между собой: в наборе документов, в отдельном документе или его фрагменте. Для этого все тексты документов, содержащихся в системе, проиндексированы на присутствие в них смыслообразующих слов, понятий и цифр (Контектный поиск на примере ИПС «КонсультантПлюс» рис.1).

 

 

Рисунок 1

 

2. Поиск нормативных материалов в режиме «картотеки».

Для поиска используются следующие параметры:

  • вид материала (нормативный акт, практика применения, комментарий и т.п.);
  • раздел по классификатору отраслей законодательства;
  • наименование (или контекст наименования) нормативного акта;
  • орган, принявший нормативный акт;
  • вид, дата (период) принятия, номер и источник публикации акта;
  • ключевые слова, характеризующие акт, и др.

(Поиск в  режиме «Картотека» на примере  ИПС «КонсультантПлюс» рис.2).

 

Рисунок 2

3. Комбинированный поиск информации. Сочетает в себе возможности и достоинства каждого из перечисленных способов поиска.

Комплексы строятся по принципу многооконных систем. В  них реализуются гибкие алгоритмы  работы со списками документов, предусматривающие возможность уточняющего поиска, просмотр последовательности карточек выбранных документов, табличный просмотр атрибутов списка (Пример «многооконности»  на примере ИПС «КонсультантПлюс» рис.3).

.

Рисунок 3

 

1.3 Возможности правовых ИПС

Отметим следующие  возможности правовых ИПС:

• ведение  конечным пользователем собственной  правовой базы или другой необходимой  ему информации на различных уровнях: аннотаций, полнотекстовых документов, баз данных (без нарушения основной структуры баз данных комплекса);

• ведение  учета, регистрации и поиска корреспонденции  пользователя (делопроизводства);

• проведение юридической экспертизы созданного пользователем документа на предмет соответствия нормативным актам и практике их применения;

• протоколирование результатов запросов с уточнением запроса после получения промежуточного списка;

• анализ исторического  среза каждого документа и  практики его использования; 
• гибкий и оперативный поиск документов даже в условиях дефицита информации о предмете поиска;

• пополнение информации в удобной для конечного  пользователя форме и в приемлемые сроки;

• телекоммуникационный доступ к серверу агентства для  сверхоперативного получения информации о вновь вышедших документах.

Дружественный интерфейс правовых комплексов не требует от пользователя специальных знаний компьютерной техники и юриспруденции. Системы постоянно совершенствуются для улучшения потребительских качеств (управления информацией, ее хранения и анализа) и способов доставки оперативной информации конечным пользователям.

 

Глава 2 Интеллектуальная обработка запросов.

Информационно-поисковой  системе, подразумевают, что она  использует предметный указатель. Предметный указатель позволяет отыскивать документы, касающиеся некоего "предмета". Для составления предметного указателя анализируется содержание документа и определяется "предмет" или "предметы", о которых в документе идет речь. Затем названия этих предметов переводятся на информационно-поисковый язык (ИПЯ). Таким образом, мы получаем поисковый образ документа (ПОД). Проиндексировав (создав поисковые образы) все информационные ресурсы, мы получаем то, что принято называть индексом (index database) - основной массив данных ИПС.

Так как процесс  поиска заключается в сопоставлении  запроса пользователя с имеющимися данными, полученный запрос также должен быть переведен на ИПЯ. После сопоставления переведенного на ИПЯ запроса и поисковых образов документов пользователь получает список ссылок на документы, которые соответствуют, по мнению системы, его запросу.

Типовая схема  ИПС, использующей предметное индексирование:

 

Как видно, поиск  происходит не по тексту документов, а  по их поисковым образам, составленным на ИПЯ. Поэтому ИПЯ - основная часть информационно-поисковой системы, от которой в первую очередь зависит качество системы. В состав информационно-поискового языка входят:

1. Словарь индексационных терминов - множество терминов индексирования.

2. Кодовый словарь - множество кодовых терминов.

3. Словарь входов - множество  входных терминов.

4. Вспомогательные средства  языка индексирования - средства, используемые  совместно с индексационными  терминами для расширения или сужения определенных понятий.

5. Правила использования  языка индексирования.

Для повышения эффективности  поиска словарь, используемый системой, должен быть контролируемым, то есть он должен быть организован таким образом, чтобы полнота и точность поиска была оптимальной. Очевидно, что организация словаря зависит от многих факторов - предметной области, в которой будет использоваться ИПС, характера интересов пользователей, степени их подготовки и т. д.

Точность и полнота  поиска зависят не только от характеристик самой ИПС, но и от того, как создается запрос. Идеальный запрос может быть составлен пользователем, в полном объеме знакомым с той предметной областью, которая его интересует, а также с используемой ИПС. Но такому пользователю ИПС, очевидно, не нужна.

Остальные же пользователи вынуждены довольствоваться или  низкой точностью поиска, или низкой полнотой. Для повышения качества поиска можно использовать различные методы. Наиболее употребляемый из них - использование логических операторов AND, OR, NOT.

Использование логических операторов - довольно простой способ повысить релевантность выдаваемых документов, но он имеет и свои недостатки. Главный из них - плохая масштабируемость. Применение оператора AND может сильно сузить выдачу, а оператора OR - сильно расширить.

Степень точности и полноты поиска зависит от того, насколько общие термины использовались при формулировке запроса. Может быть неверным использование как наиболее общих терминов (возрастает уровень информационного шума), так и слишком специфичных терминов (снижается полнота поиска). Использование слишком специфичных терминов может быть чревато еще и тем, что в словаре ИПС этого термина может не оказаться.

 

Критерий интеллектуального соответствия — это формула, в соответствии с которой производится логическое и лингвистическое преобразование (развертывание) поискового предписания с тем, чтобы обеспечить нахождение в поисковом массиве поисковых образов документов, содержащих информацию, релевантную поисковому предписанию, независимо от лексического и синтагматического способа ее представления.

Критерий интеллектуального соответствия и алгоритм поиска должны учитывать абсолютно все возможности и особенности, заложенные в основном ИПЯ тематического поиска, ИПЯ описания данных и правилах индексирования сообщений и запросов. Ведь с помощью КСС и алгоритма поиска задается вся процедура приведения в соответствие сходных по значению поисковых образов сообщений (документов или фактов) и поисковых предписаний, отождествления их с заданной степенью точности и выдачи информации из ИПС независимо от лексической и грамматической формы описания понятий, релевантных поисковому предписанию.

Именно интеллектуальная обработка запросов и алгоритм поиска (независимо от того, какую работу они предопределяют — ручную или машинную) обеспечивают возможность проведения комбинированного поиска, при котором отыскиваются документы или факты одновременно как по заданной тематике, так и по заданным учетно-регистрационным или библиографическим признакам.

Большинство автоматизированных ИПС помимо алгоритма поиска имеет также набор алгоритмов, определяющих прохождение в ИПС ряда вспомогательных процедур. К их числу относятся алгоритмы ввода информации, создания и корректировки поисковых массивов и машинных массивов словарей и классификаций, используемых в системе, опознания и выдачи для анализа новой лексики из сообщений и запросов, которых еще нет в поисковом словаре, проведения дистрибутивно-статистического анализа применения всех элементов ИПЯ в ИПС, и наконец, организации выдачи ИПС в любой форме, удобной пользователям, в том числе — в виде оригинал-макетов различных указателей, словарей, каталогов и информационных изданий.

 

Глава 3 Экспертиза запросов.

В общем виде процедура поиска является процедурой итеративной, то есть за этапом выдачи результатов поиска следует экспертиза и коррекция запроса, поиск по этому запросу и т. д. Схематично такая процедура показана на нижеприведенном рисунке 4

 

Рисунок 4

Экспертиза  и коррекция запроса происходит исходя из количества полученных документов и их релевантности, и может выполняться как пользователем, так и самой информационно-поисковой системой.

В зависимости  от соотношения полноты и точности найденных документов пользователь может сузить или расширить область поиска, перейдя к более общим или, наоборот, более специфичным терминам, а также использовав родственные понятия. В случае поиска по нескольким терминам такая коррекция области поиска может происходить по одному из нескольких терминов, что позволяет изменять эту область достаточно плавно.

Может оказаться  полезным знание пользователя о наличии определенно релевантных документов. Не найдя их в списке найденных документов, область поиска надо расширить.

Коррекция запроса  системой информационного поиска происходит на основании анализа документов, помеченных пользователем как наиболее точно отвечающих его потребности. В таком случае при следующем поиске система ищет те документы, в которых, помимо заданных в первоначальном запросе, содержатся термины, встречающиеся в документах, отмеченных пользователем.

Улучшить  результаты поиска можно различными способами, если функции для этого предоставляются интерфейсом информационно-поисковой системы.

Информация о работе Особенности построения правовых информационно-поисковых систем