Автор работы: Пользователь скрыл имя, 27 Декабря 2011 в 14:23, реферат
Выполнен обзор нейросетевых методов, используемых при распознавании изображений. Нейросетевые методы - это методы, базирующиеся на применении различных типов нейронных сетей (НС). Основные направления применения различных НС для распознавания образов и изображений:
• применение для извлечение ключевых характеристик или признаков заданных образов,
• классификация самих образов или уже извлечённых из них характеристик (в первом случае извлечение ключевых характеристик происходит неявно внутри сети),
• решение оптимизационных задач.
Архитектура искусственных НС имеет некоторое сходство с естественными нейронными сетями. НС, предназначенные для решения различных задач, могут существенно различаться алгоритмами функционирования, но их главные свойства следующие [1-3].
Применение НСХ в качестве оптимизационного метода для восстановления пространственной формы лица по двумерному полутоновому изображению (а так же для детектирования граней) описано в [14]. Здесь используется вариация НСХ – ячеистая нейронная сеть (ЯНС), в которой нейроны связаны только с ближайшими соседями из двумерной области. Матрица связей одинакова для всех нейронов и определяется характером задачи. Отмечаются хорошие результаты восстановления трёхмерной формы (в частности для изображений лиц) и высокая скорость работы.
4. Самоорганизующиеся нейронные сети Кохонена
Самоорганизующиеся нейронные сети Кохонена (СНСК) обеспечивают топологическое упорядочивание входного пространства образов. Они позволяют топологически непрерывно отображать входное n-мерное пространство в выходное m-мерное, m<<n. Входной образ проецируется на некоторую позицию в сети, кодируемую как положение активированного узла. В отличие от большинства других методов классификации и кластеризации, топологическое упорядочивание классов сохраняет на выходе подобие во входных образах [2,10], что является особенно полезным при классификации данных, имеющих большое количество классов. Например, при классификации локальных участков изображений, может быть очень большое число классов, в которых переход от одного класса к другому практически непрерывен, затрудняя определение границ классов. Сети такого типа состоят из одного слоя (не считая входного), который так же может быть организован в n-мерную решётку, в зависимости от размерности выходного пространства. Каждый нейрон связан со всеми входными нейронами. Настройка весов сети осуществляется методом конкурентного обучения, в процессе которого изменяются только веса нейрона-победителя, имеющего максимальную активность. Существует так же метод, в котором изменяются и веса нейронов, соседних с победителем. В самоорганизующихся картах Кохонена (СКК), в отличие от векторных квантователей, нейроны решётки имеют связи с соседними нейронами, сила связей зависит от расстояния между ними. Для СНСК характерна высокая скорость обучения.
В [10] трёхмерная СКК (по 5 узлов на каждое измерение) применялась для уменьшения размерности локальных участков изображения 5х5 (размерность 25). Входное изображение отображается на один из 125 узлов, положение которого в трёхмерной решётке кодирует вектор выходного пространства. Три измерения СКК принимаются за три ключевых характеристики (features [10]). Такое преобразование обеспечило частичную устойчивость к изменению освещения, смещениям и искажениям, избавило от необходимости предварительной обработки изображения (преимущество – ускорение работы), а так же значительно ускорило процесс обучения и классификации, делая эту систему применимой в реальном времени (использовалась для распознавания лиц). Отмечено так же небольшое преимущество СКК перед методом анализа главных компонент, которое заключалось в более высокой точности последующей классификации на основе данных уменьшенной размерности.
Нейронная сеть
с радиально-базисной функцией (НСРБФ)
является дальнейшим развитием НС Кохонена,
в которой после конкурентного
слоя добавлен ещё один слой, обучаемый
по методу обратного распространения.
В отличие от НС Кохонена в НСРБФ
выходами нейронов конкурентного слоя
являются значения функции Гаусса с
нормальным законом распределения,
и обнуление не победивших нейронов
не требуется. Ширина радиально-базисной
функции характеризует
В [9] применялись
две различные архитектуры
В [15] применялись
две различные архитектуры
5. Когнитрон
Когнитрон [3] своей
архитектурой похож на строение зрительной
коры, имеет иерархическую
Неокогнитрон [3]
является дальнейшим развитием идеи
когнитрона и более точно отражает
строение зрительной системы, позволяет
распознавать образы независимо от их
преобразований, вращений, искажений
и изменений масштаба. Неокогнитрон
может как самообучаться, так
и обучаться с учителем. Неокогнитрон
получает на входе двумерные образы,
аналогичные изображениям на сетчатой
оболочке глаза, и обрабатывает их в
последующих слоях аналогично тому,
как это было обнаружено в зрительной
коре человека. Конечно, в неокогнитроне
нет ничего, ограничивающего его
использование только для обработки
визуальных данных, он достаточно универсален
и может найти широкое
В зрительной коре
были обнаружены узлы, реагирующие
на такие элементы, как линии и
углы определенной ориентации. На более
высоких уровнях узлы реагируют
на более сложные и абстрактные
образы такие, как окружности, треугольники
и прямоугольники. На еще более
высоких уровнях степень
Когнитрон является мощным средством распознавания изображений, однако требует высоких вычислительных затрат, которые на сегодняшний день недостижимы [3].
6. Достоинства и недостатки
Рассмотренные
нейросетевые методы обеспечивают быстрое
и надёжное распознавание изображений.
Однако при применении этих методов
к изображениям трёхмерных объектов
возникают трудности, связанные
с пространственными поворотами
и изменением условий освещённости.
а |
б |
в |
Рис. 3.
С точки зрения
классифицирующей системы (в)
больше похоже на (б)
чем на (а)
Рис. 4.
Изображения одного
и того же лица существенно
различается при
изменении освещения.
Изображения для
различных углов поворота объекта
существенно различаются, часть
информации на изображении теряется,
возникает новая, специфическая
для данного угла. Например, лицо,
повёрнутое на некоторый угол, с
точки зрения классифицирующей системы
[16] больше похоже на лицо другого человека,
повёрнутое на такой же угол, чем на нужное
лицо, изображённое в фас (рис. 3). Аналогичная
проблема с изменением освещения (рис.
4). Такие ограничение обычно преодолеваются
путём предъявления всевозможных вариаций
изображения (различные повороты и освещённость)
при обучении, но построение такого обучающего
набора – трудная задача, и чаще всего
такие наборы недоступны. Как показывает
мировой опыт, эти проблемы не могут быть
полностью решены выбором исходного представления
данных. Поэтому к классифицирующим системам
предъявляется требование – имея конечный
репрезентативный набор вариаций образов
некоторых классов, обобщить свой опыт
на все остальные классы, не входившие
в обучающий набор. Т.е. система должна
извлечь характеристики, инвариантные
к внутриклассовым изменениям и максимально
репрезентативные по отношению к межклассовым
изменениям. Такая задача в общем виде
для систем распознавания лиц ещё не решена,
но существуют методы, которые показывают
возможности решения отдельных её аспектов
[17,18] (инвариантность к освещению, синтез
повёрнутых в пространстве изображений
лиц на основе обучения). Перспективный
подход в этом направлении описан в [10].
Так же существуют трудности, связанные с внутриклассовыми вариациями. Для лиц это различные эмоции, закрытые/открытые глаза, наличие очков и бород, изменения в причёске. Эти случаи система так же должна уметь обобщать.
В общем случае,
при распознавании человек
7. Заключение
Дан обзор различных
нейросетевых методов распознавания
изображений. Рассмотрены достоинства
и недостатки этих методов при
распознавании двумерных и
Информация о работе Нейросетевые методы распознования изображения