Автор работы: Пользователь скрыл имя, 30 Января 2014 в 10:18, контрольная работа
Переход к безбумажной технологии заключается в комплексной автоматизации процессов разработки, согласования, распространения, поиска и архивного хранения документов организации.
Системы управления документами (СУД) предназначены для автоматизации хранения, поиска и управления электронными документами разнообразных форматов, в том числе и изображениями документов. Можно сказать, что СУД фактически выполняют роль СУБД для неструктурированной информации.
Введение…………………………………………………………………………..2
Системный подход в управлении………………………………………………..4
Компоненты и общая характеристика информационных технологий экспертных систем………………………………………………………………16
Особенности сканирования, распознавания, сохранения изображений и многостраничных документов………………………………………………….22
Практическое задание…………………………………………………………...41
Заключение……………………………………………………………………….42
Список литературы………………………………………………………………
- продукционная модель позволяет легко расширять и усложнять множество правил вывода;
- фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множества присоединенных процедур;
- модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественного языка.
Как работает сканирующее устройство
В процессе ввода изображения в
компьютер в первую очередь необходимо
преобразовать его в
При этом помните, что в качестве светочувствительных элементов для сканирующих устройств обычные фотодиоды не используются. Вместо них применяются другие устройства, чаще всего — так называемые приборы с зарядовой связью (ПЗС). Они чувствительнее к незначительным перепадам яркости света и намного компактнее.
С помощью одиночного светочувствительного
элемента можно измерить яркость
только одной точки изображения,
а чтобы считать всю
В сканерах эта проблема решена по-другому. Светочувствительные ячейки располагаются в ряд, а полученная таким образом линейчатая сканирующая головка движется относительно оригинала (или оригинал относительно нее — это зависит от конструкции сканера), считывая все изображение строчка за строчкой. Подобным образом работает обычный фотоаппарат, где пленка засвечивается через узкую щель между шторками, которая перемещается от одного края кадра к другому.
В процессе ввода цветных изображений точность передачи оттенков в значительной степени зависит от освещения. Во избежание искажений цвета в каждом сканере предусмотрен встроенный источник света — высококачественная галогенная лампа. А «связующим звеном» между источником света, изображением на бумаге и матрицей ПЗС (размер которой намного меньше ширины листа) служит оптическая система, состоящая из линз и зеркал. С ее помощью поток света направляется на оригинал, а отраженные лучи фокусируются на светочувствительных элементах.
Кроме ПЗС, в сканерах могут использоваться фотодатчики других типов, в частности, так называемые фотоэлектронные умножители — ФЭУ (Photo Multiplier Tubes — РМТ). В этих приборах лучи, отраженные от оригинала, проходят между несколькими парами электродов, находящихся под высоким напряжением, за счет чего многократно усиливаются. Вследствие этого сканер с ФЭУ может различать детали даже на самых темных участках изображения.
И наконец, еще один тип светочувствительных приборов, применяемых в сканерах, — контактные оптические сенсоры (Contact Image Sensor — CIS).
Сканирующая головка, построенная
на этой технологии, представляет собой
линейку миниатюрных
В процессе считывания двумерного изображения сканирующая головка движется относительно оригинала, а следовательно, неотъемлемой частью большинства сканеров является механизм, обеспечивающий их взаимное перемещение. Исходя из его наличия и конструкции различают следующие типы сканеров.
Сканирующее устройство «просматривает» печатный материал и передает его в OCR-систему. Далее печатный материал преобразуется в изображение, которое на данном этапе нельзя отредактировать ни в одном текстовом редакторе.
Затем OCR-система анализирует (определяет блоки распознавания, выделяет в тексте строки и отдельные символы) изображение и начинает распознавать каждый его символ.
Целостное целенаправленное адаптивное распознавание
Распознавание печатного материала осуществляется на основе так называемой технологии «целостного целенаправленного адаптивного распознавания», которая базируется на трех принципах:
• Целостность.
• Адаптивность.
• Целенаправленность.
В соответствии с этими принципами OCR-система сначала выдвигает гипотезу относительно объекта распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения, при этом в каждом структурном элементе можно выделить определенные части, имеющие значение для человеческого восприятия:
• отрезки дуги кольца точки.
Целостность
Распознаваемый объект воспринимается OCR-системой в качестве целого посредством «значимых» элементов и отношений между ними.
Целенаправленность
Процесс распознавания проходит через выдвижение гипотез и целенаправленной их проверке. Это означает, что OCR-система проводит поиск, учитывает предыдущий контекст и на основе этого распознает даже разорванные и искаженные печатные символы.
Адаптивность
Под адаптивностью подразумевается способность OCR-системы к самообучению. Следуя этому принципу, OCR-система подстраивается к распознаваемому материалу на базе полученного «положительного» опыта.
В итоге в рабочей среде OCR-системы появляется распознанный текст, который можно корректировать и сохранять в том или ином формате.
Системы распознавания текстов в офисе
Основное назначение пакетов оптического распознавания символов (Optical Character Recognition, OCR) состоит в анализе растровой информации (отсканированного символа) и присвоении точечному изображению символа фиксированного электронного значения. Грубо говоря, OCR-система определяет, какой букве соответствует та или иная картинка.
Отечественные разработчики программного
обеспечения действительно
И это лишь малая толика всех задач
OCR— пакетов. Из не решенных на сегодняшний
день проблем остается уверенное
распознавание «вольных»
OCR-системы — редкий пример
офисных программ, реализующих почти
весь потенциал
Распознавание
Задача распознавания состоит в том с тем, чтобы преобразовать отсканированное изображение в текст, сохранив при этом оформление страницы. Прежде чем приступить к распознаванию текста, необходимо установить основные параметры распознавания: язык распознавания, тип печати распознанного текста и тип страницы.
Важно: Перед запуском распознавания проверьте установленные опции: язык распознавания, тип печати распознаваемого текста и тип страницы.
Вы имеете возможность:
• Распознать блок или несколько блоков, выделенных на изображении.
• Распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет.
• Распознать все нераспознанные страницы пакета.
• Распознать все страницы в фоновом
режиме. В этом режиме возможно распознавание
с одновременным
• Распознать страницы в режиме распознавание с обучением. Данный режим используется в основном для распознавания текстов, использующих декоративные шрифты, или распознавания большого объема (более 100 страниц) документов плохого качества печати.
• Распознать страницы одного пакета на нескольких компьютерах одновременно.
Запуск распознавания
Нажмите на кнопку 2-Распознать на панели Scan and Read. Из меню Процесс выберите необходимую команду:
• Распознать — чтобы распознать открытую страницу или все страницы, выделенные в диалоговом окне Пакет;
• Распознать все — чтобы распознать все нераспознанные страницы пакета;
• Распознать Блок — чтобы распознать блок или несколько блоков, выделенных на изображении;
• Запустить фоновое распознавание — чтобы запустить распознавание в фоновом режиме.
Кнопка 2-Распознать запускает распознавание открытого изображения. Для того, чтобы изменить режим кнопки, нажмите на стрелку справа от нее и из открывшегося меню выберите необходимую команду.
Важно: В процессе распознавания уже распознанной страницы перераспознаются только отредактированные и добавленные блоки.
Другие опции распознавания
Показывать или не показывать изображение при распознавании
Распознавание группы страниц происходит быстрее, если обрабатываемое изображение не отображается.
На закладке Общие (доступ: Сер
Инвертировать блок
Для того, чтобы распознать инвертированные участки изображений (текстовый блок, ячейки таблицы или всю таблицу целиком) нажмите правой кнопкой мыши на инвертированном блоке и из меню выберите команду Свойства. В раскрывшемся диалоговом окне Свойства блока активизируйте опцию Инвертированный.
Распознавание в фоновом режиме
В случае, если вы хотите одновременно
с распознаванием редактировать
распознанные страницы, вы имеете возможность
запустить распознавание в
В строке состояния появится значок. В случае, если для диалогового окна Пакет вами выбран режим показа свойства страниц (доступ: Вид к Вид со свойствами), то напротив распознаваемой страницы в колонке Открыта появится специальный значок. В этом режиме распозна вание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.
Сканирование с сохранением документа в файл PDF Самый простой способ сканировать многостраничные документы в файл PDF - нажать на кнопку PDF на сканере. Подробнее об этом — в разделе Сканирование в PDF-файл используя кнопку PDF. Вы можете сканировать документы PDF с помощью приложения Epson Scan. Сканирование многостраничных документов с сохранением в один файл PDF: Вы можете сканировать многостраничные документы с сохранением в один файл PDF. Creating a searchable PDF file: Вы можете создавать файлы PDF с возможностью поиска по тексту. (В некоторых странах эта функция может быть недоступна.) Specifying the number of pages in a single PDF file: Вы можете указать максимальное количество страниц для файла PDF. Например, при сканировании 20-страничного документа и указании максимального количества страниц для одного файла PDF равного 4, будет создано 5 файлов. Примечание:
Для сканирования с сохранением в файл PDF обратитесь к одному из следующих разделов. Сканирование в PDF-файл используя кнопку PDF Автоматический режим: Офисный режим: Сканирование с сохранением документа в файл PDF в режиме Office (Офисный) Простой режим: Сканирование с сохранением документа в файл PDF в режиме Home (Простой) Профессиональный режим: Сканир Сканирование в PDF-файл используя кнопку PDF
Введите название пользовательского размера и размер, затем щелкните кнопку Save (Сохранить) и далее кнопку OK. Новый размер появится в списке Size (Размер).
Выполните настройки, соответствующие вашему документу, и щелкните OK. Вы вернетесь к окну File Save Settings (Параметры сохранения файла). Примечание:
|
Информация о работе Компьютерные информационные технологии в ДОУ