Распознавание.
Распознавание – это отнесение конкретного объекта
(реализации), представленного значениями
его свойств (признаков), к одному из фиксированного
перечня образов (классов) по определённому
решающему правилу в соответствии с поставленной
целью.
Отсюда следует, что распознавание
может осуществляться любой системой
(живой или неживой), выполняющей следующие
функции: измерение значений признаков,
производство вычислений, реализующих
решающее правило.
Перечень образов, информативных
признаков и решающие правила либо задаются
распознающей системе извне, либо формируются
самой системой.
Для построения решающих правил
нужна обучающая выборка. Обучающая выборка –
это множество объектов, заданных значениями
признаков и принадлежность которых к
тому или иному классу достоверно известна
"учителю" и сообщается учителем
"обучаемой" системе.
Реализация методов распознавания необходима
в автоматизированных системах, предназначенных
для использования в криминалистике, медицине,
военном деле. Такие применения теории
распознавания, как кластерный анализ
(таксономия), выявление закономерностей
в множестве экспериментальных данных,
прогнозирование различных процессов
или явлений широко используются в научных
исследованиях. Большую роль методы распознавания
(классификации) играют в активно развивающихся
геоинформационных системах.
Показательным в этом отношении является
выдержка из монографии А.М. Берлянта «Геоиконика»:
«...использование карт, дешифрирование
снимков, анализ экранных видеоизображений –
это всегда распознавание и анализ графических
образов, их измерение, преобразование,
сопоставление и т.п. Отсюда следует, что
Распознавание графических образов,
то есть создание системы решающих правил
для их идентификации, классификации и
интерпретации.
Теория распознавания образов
развивалась по двум направлениям: детерминистскому
и статистическому.
Детерминистский подход включает
различные методы: эмпирические, эвристические,
в основе которых лежат здравый смысл,
более или менее удачное моделирование
действий, осуществляемых мозгом человека.
Статистический подход опирается
на фундаментальные результаты математической
статистики.
Формулировка задач
создания систем распознавания и методы
их решения
Задача №1 Определение
полного перечня признаков (параметров), характеризующих объекты или явления, для которых данная система разрабатывается.
В решении этой задачи - главное найти
все признаки, характеризующие существо
распознаваемых объектов (явлений). Любые ограничения, любая неполнота,
как мы в последующем убедимся, приводят
к ошибкам или полной невозможности правильной классификации объектов
(явлений).
Реально даже целая группа признаков
может оказаться неэффективной.
Поэтому для решения 1-ой задачи создания
СР необходимо найти все возможные признаки,
описывающие объекты распознавания, с
тем, чтобы при оценке эффективности решений
системы не возвращаться к этой задаче, обнаружив ограниченность
выбранных признаков на последующих этапах
разработки.
признаки могут подразделяться
на:
-детерминированные;
-вероятностные;
-логические;
-структурные.
Детерминированные признаки - это характеристики которые имеют
конкретные и постоянные числовые значения.
Вероятностные признаки - это характеристики носящие случайный
характер.
Логические признаки распознавания - это характеристики объекта или
явления (“да”, "нет” или “истина”, “ложь”).
Структурные признаки - непроизводные элементы (символы), примитивы изображения объекта распознавания.
ЗАДАЧА № 2 Первоначальная
классификация объектов (явлений), подлежащих распознаванию, составление априорного алфавита классов.
Нам уже знакома на описательном
уровне эта задача: необходимо выбрать
(назначить) классы объектов (явлений)
распознавания. Решение ее осуществляется
наиболее часто эвристически, как и выбор признаков распознавания,
а логика ее решения следующая:
1-е - определяется, какие решения могут приниматься по результатам распознавания
либо человеком, либо автоматической системой
управления объектом (цель распознавания).
2-е - на основе определенной выше цели формулируются требования к
системе распознавания, позволяющие выбрать принцип
классификации.
3-е - составляется априорный алфавит классов объектов (явлений).
ЗАДАЧА № 3 Разработка априорного словаря
признаков распознавания.
Таким образом, главное содержание
рассматриваемой задачи построения СР
- создание словаря, обеспечиваемого
реально возможными измерениями.
Однако, хороший или плохой набор признаков распознавания, получился
в результате указанных действий разработчика
СР, можно понять, выполнив испытания системы
распознавания в целом и оценив эффективность
распознавания.
ЗАДАЧА № 4 Описание классов априорного
алфавита на языке априорного словаря
признаков.
Априорное описание классов - наиболее
трудоемкая из задач в процессе создания системы
распознавания, требующая глубокого изучения
свойств объектов распознавания, а также и наиболее творческая задача.
В рамках этой задачи необходимо каждому классу поставить в соответствие числовые
параметры детерминированных и вероятностных
признаков, значения логических признаков и предложения, составленные из
структурных признаков-примитивов.
Значения этих параметров описаний можно
получить из совокупности следующих работ
и действий:
-специально поставленные экспериментальные работы или
--экспериментальные наблюдения;
-результаты обработки экспериментальных
данных;
-математические расчеты;
-результаты математического моделирования;
-извлечения из литературных источников.
ЗАДАЧА № 5 Выбор алгоритма
классификации, обеспечивающего отнесение
распознаваемого объекта или явления к соответствующему классу.
Непосредственное решение задачи распознавания на основе использования словаря
признаков и алфавита классов объектов
или явлений фактически заключается в разбиении пространства значений признаков распознавания
на области D1,D2,...,Dn, соответствующие
классам W1,W2,...,Wn (вспоминаем определение “образа”).
Указанное разбиение должно быть выполнено
таким образом, чтобы обеспечивались минимальные
значения ошибок отнесения классифицируемых
объектов или явлений к “чужим” классам.
Результатом такой операции является
отнесение объекта, имеющего набор признаков
X1,X2,....,Xn (точка в n-мерном пространстве), к классу
Wi, если указанная точка лежит в соответствующей классу области
признаков - Di.
ЗАДАЧА № 6 Определение рабочего алфавита
классов и рабочего словаря признаков
системы распознавания.
Суть стоящей задачи - разработка такого (рабочего) алфавита классов и такого (рабочего) словаря
признаков, которые обеспечили бы максимальное значение показателя эффективности
распознавания. То есть, из априорного
словаря мы должны выбрать признаки,
позволяющие при всех имеющихся ограничениях
на их получение (измерение) доставить максимум вероятности
правильной классификации объектов (явлений)
и (или) минимальные вероятности ошибочных
классификаций создаваемой системой. Такой выбор не может не предполагать
оценку указанных показателей до того,
как создана система.
Указанное существо задачи заставляет
снова обратить внимание на возможность
получения оценки эффективности системы
распознавания путем ее моделирования.
Об этом мы говорили при создании априорного
словаря признаков. К этому мы вернемся
при специальном рассмотрении вопросов
моделирования систем распознавания.
Классификация систем распознавания
1-й принцип.
Однородность информации
Здесь под однородностью следует понимать
- различную или единую физическую природу
информации(признаков).
По этому принципу СР делятся на:
-простые;
-сложные.
2-ой принцип классификации
СР.
(Способ получения апостериорной информации).
По этому принципу сложные системы ( а
мы уже знаем, что они собой представляют)
распознавания делятся на:
-одноуровневые;
-многоуровневые.
Многоуровневые сложные системы распознавания отличаются от одноуровневых тем, что не все признаки
от разнородных физических измерителей
используются непосредственно для решения
задачи распознавания.
3-ий принцип классификации.
(Количество первоначальной априорной
информации).
Здесь вопрос касается того, достаточно
или недостаточно априорной информации
для определения априорного алфавита
классов, построения априорного словаря
признаков и описания каждого класса на языке этих признаков в результате непосредственной
обработки исходных данных.
Соответственно этому СР делятся
на:
-системы без обучения;
-обучающиеся (ОСР) и самообучающиеся
системы (ССР).
4-ый принцип классификации.
(Характер информации о признаках
распознавания).
С характеристикой информации о признаках
распознавания мы уже имели дело при изучении
задач создания СР. В соответствии с ее
отличительными особенностями СР подразделяются
на
-детерминированные;
-вероятностные;
-логические;
-структурные (лингвистические);
-комбинированные.