Системы распознавания образов (дактилоскопические, речевые, программы-переводчики и др.)

Автор работы: Пользователь скрыл имя, 23 Декабря 2012 в 12:20, контрольная работа

Краткое описание

Теория распознавания образов — раздел информатики, развивающий теоретические основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно или нельзя переходить улицу в данный момент.
Создание искусственных систем распознавания образов остаётся сложной теоретической и технической проблемой. Необходимость в таком распознавании возникает в самых разных областях — от военного дела и систем безопасности до оцифровки всевозможных аналоговых сигналов.

Вложенные файлы: 1 файл

ипс фаниль.docx

— 38.20 Кб (Скачать файл)

    Во-вторых, затруднительно назвать какие-либо постоянные критерии для успешного деления на звуки в связи со сложностью процесса их образования.

     Вернемся к  отображениям звуков и проанализируем  общий вид гласных и сонарных звуков. Легко выявить некую общую закономерность, которая обусловлена происхождением звуков - звуки этих видов отдаленно напоминают реакцию некоторой системы на последовательность равноудаленных импульсов. Действительно, импульсами гласных и сонарных звуков являются колебания истинных и звуковых связок. Окончательный вид звуковые волны приобретают после прохождения через носоглотку, которая по своей сути является системой фильтров. Необходимо отметить, что изменения в напряжении истинных голосовых связок и артикуляции происходят значительно медленнее, чем колебания голосовых связок.

     Заметим, что  гласные и сонарные звуки состоят из участков затухания импульсов от основных (необертонных) колебаний истинных голосовых связок. Для упрощения, будем называть эти участки доменами.

     Использование  домен при распознавании речи  вполне очевидно. По сути, домен  (вспомним, что пока домен рассматривается  в приложении только к сонарным и гласным звукам) содержит в себе информацию, достаточную для распознавания звука. Если взглянуть на образ протяженно произнесенной гласной (или сонарного звука), то за исключением небольших по длине участков в начале и конце образа звук состоит из домен с высокой степенью идентичности, даже для различных людей многие характеристики, а соответственно, и общий вид домен во многом схожи, что придает особую универсальность методам распознавания при выделении и распознавании фонем через домены. Еще одним достоинством домен является относительная простота их выделения. По определению, домен начинается с максимального значения в определенном диапазоне, после которого идет затухающий по некоторому закону колебательный процесс. Как дополнительное условие, которое можно использовать при расчленении речи на домены, можно перечислить:

-стабильную (в диапазоне) длину домен;

-постоянную, с некоторой точностью, величину максимумов, по которой происходило вычленение домен.

     Доопределим понятие домена для остальных групп звуков.

     Структура  звонких шумных длительных звуков  крайне сходно со структурой  сонарных и гласных. Основным различием является наличие шума. Появление шума строго закономерно для каждого отдельно взятого звонкого шумного длительного звука, так что принцип деления на домены остается прежним.

     Будем рассматривать  шумные длительные звуки как  один домен. Это позволит легко  выделять корень этих звуков  из общего потока и облегчит  их анализ.

     Анализ образов  шумных мгновенных (взрывных) звуков  показывает наличие участков  по структуре схожих с определенным  для гласных и сонарных звуков понятием домена. Но наряду с совокупностью общих признаков прослеживается различие: для вышесказанных участков в шумных мгновенных звуках отсутствует та строгая идентичность домен между собой. Во всех мгновенных звуках присутствует момент, сильно облегчающих их выделение из речи - перед произнесением таких звуков наблюдается непродолжительная по меркам восприятия, но весьма значительная, в масштабах длительностей домен, пауза. Это помогает выделению домен. Поэтому в зависимости от различных алгоритмов выделения, может быть удобно разбивать такого рода звуки на несколько домен или же воспринимать их целиком, как один.

      При разбиении потока речи на домены мы получаем еще один уровень в распознавании. В общей иерархии он находится еще ниже, чем уровень распознавания домен. Рассмотрим функционирование такой системы.

     Процесс распознавания  начинается с поступления системы  данных об образе речи. В зависимости  от того как поступает информация  в систему, непрерывно поступающий поток или же уже отдельные пакеты (например, слова), построен алгоритм деления. Если в распоряжении данного уровня распознавания имеется слово целиком, то работу можно описать следующим образом.

     Сначала производится  предварительный анализ полученного  блока данных, результатом которого  должно являться выделение участков  шумов для распознавания глухих  шумных длительных звуков и  выделения домена взрывных звуков. Выделенные участки помечаются. Далее производится поиск максимумов  среди нулей первых производных.  Определяется список экстремумов  в диапазонах. Далее проводятся  проверки на плавное изменение  длительности домен и значение  экстремумов, что служит критерием  отбора домен.

     Полученный  список уже готов для передачи  на уровень распознавания фонем  по информационному потоку, деленному  на домены, однако возможно и  желательно введение дополнительных  проверок и формирование вспомогательной  информации для упрощения распознавания  фонем. На уровне распознавания  фонем происходит конкретизация  взрывных и глухих шумных длительных  звуков. Далее производится работа  по селекции переходных домен  и домен, по которым будет  производиться основная работа  по распознаванию фонем.

    Обобщенно говоря, уровень деления на домены  было бы точнее назвать некоторым  подуровнем в распознавании фонем,  так как здесь не происходит  преобразование вида информационного.  Однако, по своей сути процесс  выделения домен сложен и многопланен, поэтому он может рассматриваться отдельно, со своими внутренними подсистемами и совокупностью данных.

     Некоторые  части рассмотренных алгоритмов  и способов распознавания удобнее  реализовать на аппаратном уровне. Вполне достаточно системы на  основе процессора 486 DX4-100/8Мб ОЗУ.  При использовании аппаратных средств реализации, например, процессора ASP, входящего в комплект поставки некоторых плат, требования к основному процессору могут быть существенно уменьшены. По нашему мнению использование домен позволит создавать универсальные системы распознавания речи, работающие в фоновом режиме.

       Программы –переводчики. В современную эпоху НТР и информатизации общества возросла интенсивность общения между народами и странами. Однако этот процесс в значительной мере тормозится языковыми барьерами.

Обучение иностранным  языкам и переводческая деятельность в какой-то мере смягчают остроту проблемы, но полностью ее не решают. Более радикальным решением является создание систем автоматического перевода текстов с одних естественных языков на другие. Такие системы создаются во многих развитых странах мира, однако качество автоматического перевода оставляет желать лучшего.

     С точки зрения пользователя систем машинного перевода они могут подразделяться на три основных типа:

  1. Информативные, предназначенные для помощи тем, кому нужен доступ к информации на иностранном языке и кто готов пользоваться «грубым», но достаточно понятным переводом. Такие системы, как правило, имеют словари большого объема, но не опираются на новейшие достижения в лингвистике и программировании.
  2. Профессиональные, которые дают лишь черновые наброски перевода для профессиональных переводчиков и тем освобождают их от черновой работы. Такие системы теперь используются реже, – как правило, при большом объеме текущей переводческой работы, выполняемой одновременно многими специалистами в одной предметной области. Чаще в этих ситуациях переводчиков снабжают автоматическими словарями и тезаурусами с интерактивным доступом.
  3. Персональные – для авторов, желающих перевести свои статьи на иностранный язык, которым они не вполне владеют. Такие системы обычно работают в диалоге с пользователем и могут давать удовлетворительный перевод (качество которого все же зависит от того, насколько автор владеет выходным языком).

    По применяемым лингвистическим методам системы машинного перевода можно разделить также на три типа:

    Системы прямого перевода – наиболее многочисленные, поскольку начали создаваться еще в 1950-60-е годы для фиксированных пар языков. В этих системах словарь и синтаксис входного языка анализируются лишь в той мере, в какой это необходимо для идентификации правильных выражений выходного языка и порядка слов. В начале своего развития эти системы выдавали пословные переводы и лишь позднее – переводы, основанные на анализе предложений входного языка.

     Системы перевода с использованием языка-посредника, служащего для отображения «смысла» входного текста, который преобразуется в семантические и синтаксические представления, общие для нескольких выходных языков. Этот метод применяется обычно при необходимости перевода исходного текста на несколько языков (например, в переводческих центрах Европейского сообщества).

    Системы перевода с трансфером более сложны, поскольку языки-посредники применяются дважды – первый раз при переводе с входного языка, второй – при переводе на выходной язык. В этом случае становится необходимым дополнительный этап перевода – с языка-посредника входного языка на язык-посредник выходного языка. За этот счет достигается более глубокий лингвистический анализ и синтез.

    В последние годы все большее применение в машинном переводе находят методы искусственного интеллекта, которые при переводе учитывают семантику текста. Это означает, что они опираются не столько на грамматические, сколько на семантико-синтаксические категории.

    Системы машинного перевода текстов предназначены для моделирования работы человека-переводчика. Моделировать эту работу в полном объеме пока не представляется возможным, поэтому нужно стремиться при машинном переводе оперировать теми единицами языка и речи, которые позволяют наиболее точно передавать содержание текста, написанного на одном языке, средствами другого языка. Такими единицами являются, прежде всего, фразеологические обороты и терминологические словосочетания и, во вторую очередь, отдельные слова. Поэтому перспективные системы машинного перевода должны опираться на фразеологическое богатство естественных языков. Они должны быть системами фразеологического перевода.

   Концепция фразеологического машинного перевода была впервые четко сформулирована профессором Г.Г. Белоноговым в 1975 г. Далее она была развита в настоящее время и реализована в ВИНИТИ в виде двух систем: системы русско-английского перевода (RETRANS) и системы англо-русского перевода (ERTRANS).

    Если в других системах перевода в качестве основной минимальной единицы смысла, представляемой в машинных словарях, рассматривается слово, то в системах фразеологического перевода в качестве основной единицы смысла считаются фразеологические словосочетания, выражающие понятия, отношения между понятиями и ситуации. Это позволяет точнее передавать смысл переводимых текстов.

    Скорость перевода текстов в автоматическом режиме – 10-30 слов/с. Предусмотрена возможность работы в интерактивном режиме (с целью повышения качества перевода).

    Одной из важнейших проблем, стоящих перед переводом, является частое и не всегда сразу заметное изменение значений слов. Словари не всегда успевают отразить эти изменения в научно-технической терминологии.

    Особенно много действующих коммерческих систем машинного перевода (свыше 40) имеется в Японии. Почти все крупные компьютерные или производящие электронное оборудование японские фирмы разрабатывают собственные системы машинного перевода. Пользователям этих систем предоставляется грубый или более точный, выборочный или полный перевод, составление аннотаций и другие информационные услуги, в которых в разной степени участвуют профессиональные переводчики.

 

2.Определить, какая  административная ответственность  наступает за незаконное использование  экземпляров произведений. Установить  закладку на соответствующую  статью.

    Административная ответственность за использование в офисе программного обеспечения без оплаты стоимости его использования (лицензии) наступает по следующим статьям Кодекса Российской Федерации об административных правонарушениях:

    Статья 7.12. Нарушение авторских и смежных прав, изобретательских и патентных прав

    Ввоз, продажа, сдача в прокат или иное незаконное использование экземпляров произведений или фонограмм в целях извлечения дохода в случаях, если экземпляры произведений или фонограмм являются контрафактными в соответствии с законодательством Российской Федерации об авторском праве и смежных правах либо на экземплярах произведений или фонограмм указана ложная информация об их изготовителях, о местах их производства, а также об обладателях авторских и смежных прав, а равно иное нарушение авторских и смежных прав в целях извлечения дохода, за исключением случаев, предусмотренных частью 2 статьи 14.33 настоящего Кодекса, — влечет наложение административного штрафа на граждан в размере от одной тысячи пятисот до двух тысяч рублей с конфискацией контрафактных экземпляров произведений и фонограмм, а также материалов и оборудования, используемых для их воспроизведения, и иных орудий совершения административного правонарушения; на должностных лиц - от десяти тысяч до двадцати тысяч рублей с конфискацией контрафактных экземпляров произведений и фонограмм, а также материалов и оборудования, используемых для их воспроизведения, и иных орудий совершения административного правонарушения; на юридических лиц - от тридцати тысяч до сорока тысяч рублей с конфискацией контрафактных экземпляров произведений и фонограмм, а также материалов и оборудования, используемых для их воспроизведения, и иных орудий совершения административного правонарушения.

Информация о работе Системы распознавания образов (дактилоскопические, речевые, программы-переводчики и др.)