Представление знаний

Автор работы: Пользователь скрыл имя, 20 Декабря 2012 в 04:38, доклад

Краткое описание

Мы подходим к одной из основных проблем — как «научить» машину хранить и обрабатывать знания, не пользуясь помощью человека в их подготовке, а получая их на основе собственной деятельности. Эта проблема решается 6 различными направлениями в теории искусственного интеллекта:
1) Представление знаний.
2) Манипулирование знаниями.
3) Общение.
4) Восприятие.
5) Обучение.
6) Поведение.
Рассмотрим первую из них, а именно — представление знаний.

Содержание

Введение 1
Представление знаний. Теоретическая часть 3
Данные, информация и знания 3
Классификация знаний 4
Особенности представления знаний внутри ИС 4
Модели представления знаний 6
Продукционная модель 7
Логическая модель 7
Сетевая модель 8
Формальные грамматики 8
Фреймовые модели 9
Комбинаторные модели 9
Ленемы 9
Алгебраические модели 10
Нейронные сети, генетические алгоритмы 10
Заключение 12
Список литературы 13

Вложенные файлы: 1 файл

accomplishments.doc

— 324.00 Кб (Скачать файл)

Оглавление

 

Введение

 

В повседневной жизни, порой не замечая этого, человек постоянно обрабатывает ин- формацию: получает ее, запоминает, вспоминает, делает выводы, анализирует, вно- сит поправки в свои суждения, строит на основе полученных знаний и предположе- ний свое поведение. Поэтому логично предположить, что, задавшись целью создать искусственный интеллект равный по мощности (или даже превосходящий) челове- ческому, захочется наделить этот новый разум аналогичными способностями (как минимум) к восприятию окружающей среды, речи, анализу ситуации, построению выводов, предположений, обладанию «характером», памятью. Некоторые из этих пунктов весьма и весьма спорны, однако, все во многом зависит от того, какими именно чертами мы хотим наделить искусственный интеллект. Так, например, ими- тация характера и настроения совсем не обязательна и может  даже мешать дости- жению поставленных целей и объективной оценке, в то время как для прохождения теста Тьюринга она может быть необходима.

Но среди перечисленных «способностей» есть несколько, которые качественно от- личали бы искусственный разум от простого суперкомпьютера. Они касаются по- лучения и обработки информации, умения пользоваться полученными знаниями и применять их.

Таким образом мы подходим к одной из основных проблем — как «научить» машину хранить и обрабатывать знания, не пользуясь помощью человека в их подготовке, а получая их на основе собственной деятельности. Эта проблема решается 6 различ- ными направлениями в теории искусственного интеллекта:

 

 

1) Представление знаний.

 

2) Манипулирование знаниями.

 

3) Общение.

 

4) Восприятие.

 

5) Обучение.

 

6) Поведение.

 

 

Рассмотрим первую из них, а именно — представление знаний.

 

 

 

 

 

 

 

 Представление знаний. Теоретическая часть

 

 

Данные, информация и знания

 

 

 

Прежде, чем рассуждать о представлении знаний в доступном и «понятном» машине виде, требуется определиться с терминологией. Это в достаточной степени проблема- тично, так как такие термины, как «информация», «данные» и «знания» не имеют четкого определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому. Пере- числим некоторые из них, которые более точно описывают нашу предметную об- ласть.

 

Данные   — факты и идеи, представленные в некотором, четко формализован- ном виде, в котором их можно использовать для передачи в инфор- мационном процессе;

— сведения, представленные в определенной знаковой системе и на определенном материальном носителе для обеспечения возмож- ностей хранения, передачи, приема и обработки.

Информация   — данные, определенным образом организованные, имеющие для своего получателя смысл, значение и ценность, необходимые ему для принятия решений, а также реализации других функций;

— это данные, сопровождающиеся смысловой нагрузкой, помещен- ные в некоторый контекст; данные, как-либо оцениваемые получа- телем информации. При этом то, что для одних является данными, для других может оказаться информацией.

Знания   — проверенная информация и/или та информация, которой дове- ряют, результаты принятия решений, поведения, обобщенные в виде теорем и законов, совокупности взглядов;

— зафиксированная и проверенная практикой информация, которая может многократно использоваться людьми для решения тех или иных задач.


 

 

Таким образом, мы получаем следующие закономерности:


 

 

Данные

имеют смысл

 

Информация

проверенная

 

Знания

   

 

 

При этом на данной диаграмме при движении слева направо уменьшается формали- зованность представления. И стоящая перед нами задача — представление  знаний, самой неформальной сущности.

 

 

 

 

 

 

 

 

 

Классификация знаний

 

 

 

Знания

 

 

 

 

 

степень научности


 

 

 

 



вненаучные


 

 

 

 

 

 

научные


 

 

 

 

 

 

эмпирические  теоретические

 

 

 

Можно найти и другие критерии для классификации знаний, но уже этого достаточ- но, чтобы показать разнородность человеческих знаний. Так, эмпирическое знание может быть одновременно и процедурным и личностным.

Логично предположить, что для описания той или иной категории лучше подходят определенные средства, в то время как другие значительно понижают эффектив- ность хранения и/или использования. Остановимся на общих моментах, абстрагиро- вавшись от вида категории знаний.

 

 

Особенности представления  знаний внутри ИС

 

 

Представление знаний в памяти ЭВМ или на внешних носителях должно иметь особенности, отличающие знания от данных, например, такие как:

 

 

∙ внутренняя интерпретируемость;

 

 

 

 

 

 

 

∙ структурированность;

 

∙ связность;

 

∙ семантическая метрика;

 

∙ активность;

 

∙ конвертируемость.

 

 

Сперва следует отдельно указать, что обрабатываемой единицей для знаний является факт, а не запись данных. Факт — это некоторая запись, наделенная семантикой.

Теперь  рассмотрим каждый вышеобозначенный пункт в отдельности.

Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в кото- рых это имя упомянуто. Роль «имени» может выполнять набор аттрибутов. Смысл такого расширения данных — идентифицировать данные и их назначение должна уметь не только посторонняя программа, которая обладает информацией  о том, как правильно расшифровать эти данные, но и сама система.

Структурированность. Информационные единицы должны обладать гибкой струк- турой. Для них может выполняться рекурсия — вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольно- го установления между отдельными информационными единицами отношений типа

«часть—целое», «род—вид» или «элемент—класс».

Связность. Между информационными единицами должна быть предусмотрена воз- можность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информационные единицы могут быть связаны отношением «одновременно», две информационные единицы — отношением «причина—следствие» или «быть рядом».

Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее их ситуационную близость, т.е. силу ассоциативной связи. Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным, но не имеющие с ними прямой связи. Этот пункт считается критичным для моделирования человеческих воспоминаний, построения ассоциаций, моделирования процесса генерации идей.

Активность. Данные обычно пассивны и используются командами в случае необходимости. Для ИС выполнение программ должно наоборот инициироваться текущим состоянием системы.

Конвертируемость. Содержание знаний не должно зависить от его записи. Поэтому форма представления, уровень детализации и степень неопределенности информации

 

 

 

 

 

 

 

о предметной области может трансформироваться в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.

 

 

Модели представления знаний

 

Среди множества разработанных моделей представления знаний можно выделить два основных подхода: эмпирический и теоретический.

 

 

Модели представления знаний

 

 

 

 

эмпирические  теоретические

 

 

 

 

 

продукционные м. 

логические м.

 

 

 

 

 


сетевые м. 

формальные  грам.

 

 

 

 

 

 

фреймовые м. 

комбинаторные м.

 

 

 

 

 

 

ленемы 

алгебраические м.

 

 

 

 

 

нейронные сети генетические алгоритмы

 

 

Эмпирический  подход основывается на исследовании сознания человека, изучении принципов организации памяти и моделировании механизмов решения задач.

Другой подход — теоретический, можно также назвать теоретически обоснованным. Он «гарантирует» правильность решений. В рамках этого подхода до настоящего

 

 

 

 

 

 

 

 

времени удавалось решать только сравнительно простые задачи из узкой предметной области.

Кроме моделей, разработанных в рамках каждого из этих подходов, отдельно выделяют (относя к обоим подходом сразу) бионическое направление, представленное генетическими алгоритмами и нейронными сетями.

В каждом подходе мы увидим свое отношение и к тому, что является знанием, и к тому, как его представлять. Если в теоретических моделях знания строго формализованы, то эмпирические призваны дать некоторую свободу. Однако, ценой за эту свободу будет потенциальная невыводимость некоторых решений и невозможность найти ответ на поставленный вопрос, когда теоретические модели это гарантируют.

Рассмотрим каждую из моделей.

 

 

Продукционная модель

 

Это одна из самых распространенных моделей представления знаний. В ее основе лежит набор правил вида «если условие, то действие», описывающих знания. Оперируя  этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию.

Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.

 

 

Логическая модель

 

 

Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а построение выводов и получение новых знаний сводится к реализации процедуры логического вывода. Этот процесс может быть строго формализован, так  как в его основе лежит классический аппарат математической логики.

Сложности могут возникнуть при описании неоднородных миров (объекты относятся к разным категориям и их связывают различные отношения). Для преодоления этой и других сложностей в конкретных предметных областях используют расширенные модели, использующие нечеткую логику, оперирующие эмпирическими кванторами.

 

 

 

 

 

 

 

 

Такие расширенные модели объединяют возможности логического и лингвистического подходов, в результате чего называются логико-лингвистическими моделями данной предметной области.

 

 

Сетевая модель

 

Сетевая модель (или семантическая сеть)  в инженерии знаний представляется направленным графом, узлы  которого соответствуют  понятиям и объектам, а дуги — отношениям между ними. В сетевой модели основными отношениями являются is-a и part-of, с помощью которых можно описать большой объем знаний.

Семантическая сеть позволяет снизить объем хранимых данных, обеспечивает реализацию ассоциативных связей. Проблема гибкости модели и существования бесконечного множества возможных связей решается добавлением новых типов отношений. В проектах, посвященных моделированию человеческой памяти, также было предложено при использовании расширяемой подобным образом семантической сети также строить модель, хранящую все типы соединений и отношения подобия и взаимозаменяемости между ними.

 

 

Формальные грамматики

 

Форальная грамматика (теория) состоит из алфавита (словаря), множества синтаксических правил, которые позволяют определить истинность или ложность выражений, построенных в данном языке, базовой системы подобных выражений, которые всегда истинны и называются аксиомами, множества правил вывода, позволяющих преобразовывать одно выражение в другое.

В основе этой модели лежит исчисление высказываний, которое можно считать классическим примером аксиоматических систем. Эта система хорошо исследована и имеет разработанную модель логического вывода. Эти свойства переносятся и на модель, ее использующую.

Информация о работе Представление знаний