Экспертные системы

Автор работы: Пользователь скрыл имя, 27 Июня 2013 в 16:04, курсовая работа

Краткое описание

Экспертные системы (ЭС)- это набор программ, выполняющий функции эксперта при решении задач из некоторой предметной области. Они возникли как значительный практический результат в применении и развитии методов искусственного интеллекта (ИИ)- совокупности научных дисциплин, изучающих методы решения задач интеллектуального (творческого) характера с использованием ЭВМ. ЭС выдают советы, проводят анализ, дают консультации, ставят диагноз. Практическое применение ЭС на предприятиях способствует эффективности работы и повышению квалификации специалистов.

Содержание

Введение 2
Глава I. Экспертные системы, их особенности. Применение 3
экспертных систем. 3
Глава II. Структура экспертной системы. 7
Глава III. Модели представления знаний. 8
3.1 Логическая модель представления знаний. 9
3.2 Продукционная модель представления знаний. 10
3.3 Представление знаний фреймами. 12
3.4 Представление знаний семантическими сетями. 14
Список использованной литературы. 17

Вложенные файлы: 1 файл

kurs.doc

— 115.00 Кб (Скачать файл)

3.2 Продукционная модель представления  знаний.

 

В модели правил знания  представлены совокупностью правил вида “ЕСЛИ  – ТО”. Системы с базами знаний, основанные на этой модели, называются продукционными системами. Эти системы бывают двух диаметрально противоположных типов – с прямыми и обратными выводами. Типичным представителем первого типа является система MYCIN, используемая для решения задач диагностического характера, а типичным представителем систем второго типа – OPS, используемая для решения проектирования задач.

В системе продукций с обратными  выводами с помощью правил строится дерево И/ИЛИ, связывающее в единое целое факты и заключения; оценка этого дерева на основании фактов, имеющихся в базе данных, и есть логический вывод. Логические выводы бывают прямыми, обратными и двунаправленными. При прямом выводе отправной точкой служат предоставленные данные, процесс оценки приостанавливается в узлах с отрицанием, причем в качестве заключения (если не все дерево пройдено) используется гипотеза, соответствующая самому верхнему уровню дерева (корню). Однако для такого вывода характерно большое количество данных, а также оценок дерева, не имеющих прямого отношения к заключению, что излишне. Преимущество обратных выводов в том, что оцениваются только те части дерева, которые имеют отношение к заключению, однако если отрицание или утверждение невозможны, то порождение дерева лишено смысла. В двунаправленных выводах сначала оценивается небольшой объем полученных данных и выбирается гипотеза (по примеру прямых выводов), а затем запрашиваются данные, необходимые для принятия решения о пригодности данной гипотезы. На основе этих выводов можно реализовать более мощную и гибкую систему.

Системы продукций с прямыми  выводами среди систем, основанных на использовании знаний, имеют наиболее давнюю историю, поэтому они являются в некотором смысле основополагающими. Эти системы включают три компонента: базу правил, состоящую из набора продукций (правил вывода), базу данных, содержащую множество фактов, и интерпретатор для получения логического вывода на основании этих знаний. База правил и база данных образуют базу знаний, а интерпретатор соответствует механизму логического вывода. Вывод выполняется в виде цикла “понимание – выполнение”, причем в каждом цикле выполняемая часть выбранного правила обновляет базу данных. В результате содержимое базы данных преобразуется от первоначального к целевому, т.е. целевая система синтезируется в базе данных. Иначе говоря, для системы продукций характерен простой цикл выбора и выполнения (или оценки) правил, однако из-за необходимости периодического сопоставления с образцом в базе правил (отождествлением) с увеличением числа последних (правил) существенно замедляется скорость вывода. Следовательно, такие системы не годятся для решения крупномасштабных задач. Упорядочим слабые и сильные стороны хорошо известных  систем продукций. Сильные стороны:

  1. Простота создания и понимания отдельных правил;
  2. Простота пополнения, модификации и аннулирования;
  3. Простота механизма логического вывода.

Слабые стороны:

  1. Неясность взаимных отношений правил;
  2. Сложность оценки целостного образа знаний;
  3. Крайне низкая эффективность обработки;
  4. Отличие от человеческой структуры знаний;
  5. Отсутствие гибкости в логическом выводе.

Таким образом, если объектом является небольшая задача, выявляются только сильные стороны системы продукций. В случаях увеличения объема знаний, необходимости решения сложных задач, выполнения гибких выводов или повышения скорости вывода требуется структурирование базы данных. Первое, что приходит в голову в таких случаях, - это группировка знаний и структурирование базы данных. Другими словами, путем предварительной группировки соответствующих правил в некотором состоянии процесса вывода можно ограничить диапазон выбора правил. В тех случаях, когда объекты, для которых используются правила, также имеют иерархическую структуру, эффективным является структурирование базы данных. Этот подход был реализован в системах EMICIN и MECS-AI, разработанных на базе системы MYCIN с применением универсального языка представления знаний.

Расширенным вариантом модели правил является модель доски объявлений (blackboard), которая была предложена в системе распознавания разговорной речи HEARSAY-II как модель представления знаний.

3.3 Представление знаний фреймами.

 

Фреймовая модель, или модель представления  знаний, основанная на фреймовой теории М. Минского,  представляет собой систематизированную модель памяти человека и его сознания.

Теория фреймов - это парадигма для представления знаний с целью использования этих знаний компьютером. Впервые была представлена Минским в 1975 году, как попытка построить фреймовую сеть, или парадигму с целью достижения большего эффекта понимания. С одной стороны он пытался сконструировать базу данных, содержащую энциклопедические знания, но с другой стороны,  хотел создать наиболее описывающую базу, содержащую информацию в структурированной и упорядоченной форме. Эта структура позволила бы компьютеру вводить информацию в более гибкой форме, имея доступ к тому разделу, который требуется в данный момент. Минский разработал такую схему, в которой информация содержится в специальных ячейках, называемых фреймами, объединенными в сеть, называемую системой фреймов. Новый фрейм активизируется с наступлением новой ситуации. Отличительной его чертой является то, что он одновременно содержит большой объем знаний и в то же время является достаточно гибким для того, чтобы быть использованным как отдельный элемент базы данных. Термин «фрейм» был наиболее популярен в середине семидесятых годов, когда существовало много его толкований, отличных от интерпретации Минского.

Итак, как было сказано выше фреймы – это фрагменты знания, предназначенные  для представления стандартных  ситуаций. Термин «фрейм» (Frame – рамка) был предложен Минским. Фреймы имеют вид структурированных компонентов ситуаций, называемых слотами. Слот может указывать на другой фрейм, устанавливая, таким образом, связь между двумя фреймами. Могут устанавливаться общие связи типа связи по общению. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например ожидаемые процедуры ситуации, способы получения информации о слотах, значение принимаемые по умолчанию, правила вывода.

Формальная структура фрейма имеет  вид:

f[<N1, V1>, <N2, V2>, …, <Nk,Vk>],

где f – имя фрейма; пара <Ni, Vi> - i-ый слот, Ni – имя слота и Vi – его значение.

Значение слота может быть представлено последовательностью

<K1><Li>;...; <Kn><Ln>; <R1>; …; <Rm>,

где Ki – имена атрибутов, характерных для данного слота; Li – значение этих атрибутов, характерных для данного слота; Rj – различные ссылки на другие слоты.

Каждый фрейм, как структура  хранит знания о предметной области (фрейм–прототип), а при заполнении слотов знаниями превращается в конкретный фрейм события или явления.

Фреймы можно разделить на две  группы: фреймы-описания; ролевые фреймы.

Рассмотрим пример.

Фрейм описание: [<программное обеспечение>, <программа 1С бухгалтерия, версия 7.7>, <программа 1С торговля, версия 7.7>, <правовая программа «Консультант +» проф.>].

Ролевой фрейм: [<заявка на продажу>, <что, установка и покупка программы 1С торговля, версия 7.7>, <откуда, фирма ВМИ>, <куда, фирма «Лукойл»>, <кто, курьер Иванова>, <когда, 27 октября 1998г.>].

Во фрейме-описании в качестве имен слотов задан вид программного обеспечения, а значение слота характеризует массу и производителя конкретного вида продукции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов. Для данного примера представлены уже описания конкретных фреймов, которые могут называться либо фреймами – примерами, либо фреймами – экземплярами. Если в приведенном примере убрать значения слотов, оставив только имена, то получим так называемый фрейм – прототип.

Достоинство фрейма – представления во многом основываются на включении в него предположений и ожиданий. Это достигается за счет присвоения по умолчанию слотам фрейма стандартных ситуаций. В процессе поиска решений эти значения могут быть заменены более достоверными. Некоторые переменные выделены таким образом, что об их значениях система должна спросить пользователя. Часть переменных определяется посредством встроенных процедур, называемых внутренними. По мере присвоения переменным определенных значений осуществляется вызов других процедур. Этот тип представления комбинирует декларативные и процедурные знания.

Фреймовые модели обеспечивают требования структурированности и связанности. Это достигается за счет свойств наследования и вложенности, которыми обладают фреймы, т.е. в качестве слотов может выступать система имен слотов более низкого уровня, а также слоты могут быть использованы как вызовы каких-либо процедур для выполнения.

Для многих предметных областей фреймовые  модели являются основным способом формализации знаний.

3.4 Представление знаний семантическими  сетями.

 

Одним из способов представления знаний является семантическая сеть. Изначально семантическая сеть была задумана как модель представления структуры долговременной памяти в психологии, но впоследствии стала одним из основных способов представления знаний в инженерии знаний.

Моррис дал точное определение  семантическим и прагматическим отношениям в семиотике и определил их как проблемы различных функциональных уровней. Другими словами, семантика означает определенные (общие) отношения между символами и объектами, представленными этими символами, а прагматика – выразительные (охватывающие) отношения между символами и создателями (или пользователями) этих символов.

Первоначально в психологии изучались объекты, именуемые семантическими с точки зрения известных ассоциативных свойств, накапливаемых в системе обучения и поведения человека. Однако с развитием психологии познания стали изучаться семантические структуры, включающие некоторые объекты. Затем были изучены принцип действия человеческой памяти (способы хранения информации и знаний), в частности предположительные (гипотетические) структурные модели долговременной памяти, и созданы моделирующие программы, понимающие смысл слов.

Одной из структурных моделей долговременной памяти является предложенная Куиллианом модель понимания смысла слов, получившая название TLC- модели (Teachable Language Comprehender: доступный механизм понимания языка). В данной модели для описания структуры долговременной памяти была использована сетевая структура как способ представления семантических отношений между концептами (словами). Данная модель имитирует естественное понимание и использования языка человеком. Поэтому основной ее идеей было описание значений класса, к которому принадлежит объект, его прототипа и установление связи со словами, отображающими свойства объекта. В качестве примера на схеме 2 показана весьма простая семантическая сеть для представления концептуального объекта “чайник”. В этой сети определены операторы отношений, называемые классом, свойством и примером, для которых описаны значения.

Схема 2


 

                                                                                           В модели Куиллиана концептуальные объекты представлены ассоциативными сетями, состоящими из вершин, показывающих концепты, и дуг, показывающих отношения между концептами. Например, в сети, показанной на схеме 2, с отношением “класс” ассоциируется значение “ёмкость”, со свойством – “металлический”, “фарфоровый”, “наличие носика”, с примером – “металлический чайник”. Подобная ассоциативная структура называется плоскостью, описываемые концепты объекта называются вершинами типа, а связанные с ними соответствующие отдельные слова – вершинами лексем. В любой плоскости существует одна вершина типа и только необходимое для определения концептов, описывающих его, число вершин лексем.


Вершины лексем определяют всевозможные сущности, имеющие место в реальном мире, например, классы, свойства, примеры, время, место, средство, объекты и т. п. Преимущество лексем по сравнению с типами заключается в экономии пространства памяти ЭВМ. Это означает и факт предотвращения дублирования определения концептов.

Итак, исходя из приведенных выше соображений, можно сделать вывод, что в  TLC-модели используется представление знаний в форме “элемент”  и ”свойства”. Другими словами, можно попытаться структурировать знания, заменив вершину типа на элемент, а вершину лексемы на свойство.  Благодаря этому данные, основанные на фактах,  в долговременной памяти можно представить с помощью структур трех типов: элементы, свойства и указатели. Элемент представлен заключением, называемым фактом, например объектом, событием, понятием и т. п., обычно за элемент принимается отдельное слово, имя существительное, предложение или контекст. Свойство – это структура, описывающая элемент, оно соответствует таким частям речи как имя прилагательное, наречие, глагол и т.д. указатели связывают элементы и свойства.

Важность модели семантической  сети Куиллиана с точки зрения многочисленных приложений определяется следующими моментами:

  1. В отличие от традиционных методов семантической обработки с анализом  структуры предложения были предложены новые парадигмы в качестве модели представления структуры долговременной памяти, в которой придается значение объему языковой активности.
  2. Был предложен способ описания структуры отношений между фактами и понятиями с помощью средства, называемого семантической сетью, отличающейся несложным представлением понятий, а также способ семантической обработки в мире понятий на основе смысловой связи (смыслового обмена) между прототипами.
  3. Была создана реальная система TLC, осуществлено моделирование человеческой памяти и разработана технолгическая сторона концепции понимания смысла.

Информация о работе Экспертные системы