Автор работы: Пользователь скрыл имя, 27 Декабря 2011 в 14:23, реферат
Выполнен обзор нейросетевых методов, используемых при распознавании изображений. Нейросетевые методы - это методы, базирующиеся на применении различных типов нейронных сетей (НС). Основные направления применения различных НС для распознавания образов и изображений:
• применение для извлечение ключевых характеристик или признаков заданных образов,
• классификация самих образов или уже извлечённых из них характеристик (в первом случае извлечение ключевых характеристик происходит неявно внутри сети),
• решение оптимизационных задач.
Архитектура искусственных НС имеет некоторое сходство с естественными нейронными сетями. НС, предназначенные для решения различных задач, могут существенно различаться алгоритмами функционирования, но их главные свойства следующие [1-3].
НЕЙРОСЕТЕВЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ
The short review of neural
network approaches for image recognition is given. The application of
this approaches for face recognition problem is showed.
Выполнен обзор нейросетевых методов, используемых при распознавании изображений. Нейросетевые методы - это методы, базирующиеся на применении различных типов нейронных сетей (НС). Основные направления применения различных НС для распознавания образов и изображений:
Архитектура искусственных
НС имеет некоторое сходство с
естественными нейронными сетями. НС,
предназначенные для решения
различных задач, могут существенно
различаться алгоритмами
НС состоит
из элементов, называемых формальными
нейронами, которые сами по себе очень
просты и связаны с другими
нейронами. Каждый нейрон преобразует
набор сигналов, поступающих к
нему на вход в выходной сигнал. Именно
связи между нейронами, кодируемые
весами, играют ключевую роль. Одно из
преимуществ НС (а так же недостаток
при реализации их на последовательной
архитектуре) это то, что все элементы
могут функционировать
Опишем применение НС для распознавания изображений, отмечая возможности применения для распознавания человека по изображению лица.
1. Многослойные нейронные сети
Архитектура многослойной
нейронной сети (МНС) состоит из последовательно
соединённых слоёв, где нейрон каждого
слоя своими входами связан со всеми
нейронами предыдущего слоя, а
выходами - следующего. НС с двумя
решающими слоями может с любой
точностью аппроксимировать любую
многомерную функцию. НС с одним
решающим слоем способна формировать
линейные разделяющие поверхности,
что сильно сужает круг задач ими
решаемых, в частности такая сеть
не сможет решить задачу типа “исключающее
или”. НС с нелинейной функцией активации
и двумя решающими слоями позволяет
формировать любые выпуклые области
в пространстве решений, а с тремя
решающими слоями - области любой
сложности, в том числе и невыпуклой.
При этом МНС не теряет своей обобщающей
способности. Обучаются МНС при
помощи алгоритма обратного
Простейшее применение однослойной НС [6] (называемой автоассоциативной памятью) заключается в обучении сети восстанавливать подаваемые изображения. Подавая на вход тестовое изображение и вычисляя качество реконструированного изображения, можно оценить насколько сеть распознала входное изображение. Положительные свойства этого метода заключаются в том, что сеть может восстанавливать искажённые и зашумленные изображения, но для более серьёзных целей он не подходит.
Рис. 1.
Многослойная нейронная
сеть для классификации
изображений. Нейрон
с максимальной активностью (здесь
первый) указывает
принадлежность к
распознанному классу.
МНС так же используется
для непосредственной классификации
изображений – на вход подаётся
или само изображение в каком-либо
виде, или набор ранее извлечённых
ключевых характеристик изображения,
на выходе нейрон с максимальной активностью
указывает принадлежность к распознанному
классу (рис. 1). Если эта активность
ниже некоторого порога, то считается,
что поданный образ не относится
ни к одному из известных классов.
Процесс обучения устанавливает
соответствие подаваемых на вход образов
с принадлежностью к
Подход к классификации с использованием частотных характеристик всего изображения, описан в [7]. Применялась однослойная НС, основанная на многозначных нейронах. Отмечено 100% распознавание на базе данных MIT, но при этом осуществлялось распознавание среди изображений, которым сеть была обучена.
Применение МНС для классификации изображений лиц на основе таких характеристик, как расстояния между некоторыми специфическими частями лица (нос, рот, глаза), описано в [8]. В этом случае на вход НС подавались эти расстояния. Использовались так же гибридные методы – в первом на вход НС подавались результаты обработки скрытой марковской моделью, а во втором – результат работы НС подавался на вход марковской модели. Во втором случае преимуществ не наблюдалось, что говорит о том, что результат классификации НС достаточен.
В [9] показано применение НС для классификации изображений, когда на вход сети поступают результаты декомпозиции изображения по методу главных компонент.
В классической
МНС межслойные нейронные соединения
полносвязны, и изображение представлено
в виде одномерного вектора, хотя
оно двумерно. Архитектура свёрточной
НС [10] направлена на преодоление этих
недостатков. В ней использовались
локальные рецепторные поля (обеспечивают
локальную двумерную связность
нейронов), общие веса (обеспечивают
детектирование некоторых черт в
любом месте изображения) и иерархическая
организация с
МНС применяются
и для обнаружения объектов определённого
типа. Кроме того, что любая обученная
МНС в некоторой мере может
определять принадлежность образов
к “своим” классам, её можно специально
обучить надёжному
Рис. 2.
Главные компоненты (собственные
лица) и разложение
изображения на главные
компоненты.
НС применяется
так же для извлечения ключевых характеристик
изображения, которые затем используются
для последующей классификации.
В [1,6], показан способ нейросетевой
реализации метода анализа главных
компонент. Суть метода анализа главных
компонент заключается в
2. Нейронные сети высокого порядка
Нейронные сети
высокого порядка (НСВП) отличаются от
МНС тем, что у них только один
слой, но на входы нейронов поступают
так же термы высокого порядка, являющиеся
произведением двух или более
компонент входного вектора [1]. Такие
сети так же могут формировать
сложные разделяющие
В [12] показано применение НСВП строго третьего порядка для распознавания изображений лиц, имеющих произвольные масштабы и двумерные повороты. Приведены методы обучения таких сетей. Особенность такой сети заключаются в том, что для обучения некоторому классу достаточно предъявить его образ без вариаций масштабов и поворотов – после обучения сеть будет распознавать известные классы инвариантно к масштабу и поворотам. Такая сеть не является полносвязной, быстро обучается и работает. Отмечено существенное повышение точности классификации такой сетью повёрнутых и масштабированных изображений по сравнению с МНС.
3. Нейронные сети Хопфилда
НС Хопфилда (НСХ) является однослойной и полносвязной (связи нейронов на самих себя отсутствуют), её выходы связаны со входами. В отличие от МНС, НСХ является релаксационной – т.е. будучи установленной в начальное состояние, функционирует до тех пор, пока не достигнет стабильного состояния, которое и будет являться её выходным значением. НСХ применяются в качестве ассоциативной памяти и для решения оптимизационных задач. В первом случае НСХ обучается без учителя (например, по правилу Хебба), во втором случае веса между нейронами изначально кодируют решаемую задачу. НСХ бывают синхронными, когда одновременно пересчитываются все нейроны и асинхронными, когда пересчитывается случайно выбранный нейрон. Для исследования динамики функционирования НСХ используются методы Ляпунова. Показано [1], что асинхронная НСХ всегда сходится к устойчивым точкам, а аттракторами синхронной НСХ являются устойчивые стационарные точки и предельные циклы длины два. Таким образом НСХ из начального состояния сходится к ближайшему локальному минимуму энергии сети, состояние нейронов в котором и будет восстановленным образом для задач распознавания, и решением – для оптимизационных задач. Для поиска глобального минимума применительно к оптимизационным задачам используют стохастические модификации НСХ [1].
Применение НСХ
в качестве ассоциативной памяти
позволяет точно
Информация о работе Нейросетевые методы распознования изображения