сканеры и программное обеспечение распознавания
символов
Цели:
- Что такое сканер.
- Понять как работает программное
обеспечение распознавания символов.
Ска́нер.
- Это устройство, выполняющее преобразование
расположенного на плоском носителе (чаще
всего бумаге) изображения в цифровой формат. Процесс получения такой цифровой копии называется сканированием.
Во время сканирования при
помощи АЦП создаётся цифровое описание
изображения внешнего для ЭВМ образа объекта,
которое затем передаётся посредством
системы ввода-вывода в ЭВМ.
Виды сканеров
- Бывают ручные, рулонные (англ. Sheet-Feed), планшетные и проекционные сканеры. Разновидностью проекционных сканеров являются слайд-сканеры, предназначенные для сканирования фотоплёнок. В высококачественнойполиграфии используются
барабанные сканеры, в которых в качестве
светочувствительного элемента используется фотоэлектронный
умножитель (ФЭУ).
- Принцип
работы однопроходного планшетного сканера
состоит в том, что вдоль сканируемого
изображения, расположенного на прозрачном
неподвижном стекле, движется сканирующая
каретка с источником света. Отраженный
свет через оптическую систему сканера
(состоящую из объектива и зеркал или призмы)
попадает на три расположенных параллельно
друг другу фоточувствительных полупроводниковых элемента на
основе ПЗС, каждый из которых принимает
информацию о компонентах изображения.
История
- В 1857 году флорентийский аббат Джованни Казелли (итал. Giovanni Caselli) изобрёл прибор для передачи изображения на расстояние,
названный впоследствии пантелеграф. Передаваемая картинка наносилась на барабан токопроводящими чернилами и считывалась с помощью иглы.
- В 1902 году, немецким физиком Артуром Корном (нем. Arthur Korn) была запатентована технология фотоэлектрического
сканирования, получившая впоследствии
название телефакс. Передаваемое изображение закреплялось на прозрачном вращающемся барабане, луч света от лампы, перемещающейся вдоль оси барабана, проходил сквозь оригинал и через расположенные на оси барабана призму и объектив попадал на селеновый фотоприёмник.
Эта технология до сих пор применяется
в барабанных сканерах.
- В дальнейшем, с развитием полупроводников, усовершенствовался фотоприёмник, был изобретен планшетный способ сканирования, но сам принцип оцифровки изображения остаётся почти неизменным.
Сканеры применяют для ввода в компьютер
рисунков, которые сразу же можно обрабатывать
в графическом
редакторе. Сканеры
лучше вводят плоское изображение в компьютер,
чем цифровые камеры
Виды Сканеров
Сканер – это устройство, которое,
анализируя какой-либо объект (обычно
изображение, текст), создаёт цифровую
копию изображения объекта. Процесс получения
этой копии называется сканированием.
- Сканер изображений — устройство, выполняющее преобразование
изображений в цифровой формат.
- Ручной сканер - (сканер не стационарный)
- Сканер штрих-кода — устройство для считывания информации,
представленной в виде штрих-кода.
- Сканер киноплёнки — устройство для преобразования
изображения на киноплёнке в цифровые
файлы высокого разрешения.
- 3D-сканер — устройство
для считывания формы объёмного объекта.
- Биометрические сканеры используются для целей идентификации
личности; например:
- Сканер сетчатки глаза считывает рисунок сетчатки глаза;
- Сканер отпечатка пальца считывает папиллярный рисунок подушечки
пальца руки.
- Сканер портов — программный инструмент в области
сетевых технологий.
- Сканеры уязвимостей — программные или аппаратные средства
для диагностики сетевых компьютеров
на предмет возможных проблем в системе
безопасности.
- Сканер
в программировании — часть компилятора, осуществляющая лексический анализ.
- Сканирующий радиоприёмник — радиоприёмник, осуществляющий поиск радиопередачи на заданных частотах или в заданном диапазоне.
- Сканер (телепередача) — познавательная телепередача, состоящая
из нескольких кратких сюжетов.
Оптическое распознавание символов
- механический или электронный
перевод изображений рукописного, машинописного или печатного текста
в текстовые
данные —
последовательность кодов, использующихся дляпредставления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или
для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный
перевод, форматирование или преобразование
в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания
образов, искусственного
интеллекта и компьютерного зрения.
- истемы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого
символа, программа одновременно могла
работать только с одним шрифтом. В настоящее
время больше всего распространены так
называемые «интеллектуальные» системы,
с высокой степенью точности распознающие
большинство шрифтов. Некоторые системы
оптического распознавания текста способны
восстанавливать исходное форматирование
текста, включая изображения, колонки
и другие нетекстовые компоненты.
Программное обеспечение сканеров.
При решении вопроса о приобретении
сканера важнее всего правильно выбрать
программное обеспечение, которое наилучшим
образом могло бы соответствовать конкретным
задачам сканирования.
В настоящее время имеется довольно
много прикладных пакетов для сканирования
текстовой и графической информации.
При выборе конкретного программного
обеспечения для сканера рекомендуется
принимать во внимание следующие характеристики
:
- - наличие механизма
предварительного сканирования, который
обеспечивает возможность выполнения
однократного сканирования всей страницы,
с последующим выбором участков меньшего
размера для окончания сканирования.
- - возможность установки широкого диапазона разрешений, что позволяет выбирать требуемую для каждого конкретного случая величину. Как правило, это важно при работе с фотографиями и графической информацией.
- - возможность регулирования контрастности и яркости.
- - возможность редактирования изображений.
- - возможность создания файлов, формат которых соответствовал бы другим используемым в системе пакетам.
ДРАЙВЕРА
- Любой драйвер любого
сканера предназначен для того, чтобы из используемого
вами приложения (например, Photoshop или PhotoEditor) запускать процесс сканирования, осуществлять предварительные корректировки изображения, задание и просмотр области сканирования и т. п. Именно с помощью программы сканирования задаются все необходимые установки (разрешение, цветовой режим, автоматическая коррекция и прочие). Для того чтобы проблемы с несовместимостью тех или иных драйверов и графических редакторов свести на нет, был разработан стандарт TWAIN (неожиданна расшифровка названия Technology Without An Important Name - Технология Без Специального Названия), которому теперь отвечают практически все драйверы и графические приложения. Приобретая сканер, необходимо помнить, что взаимодействие со сканером возможно ТОЛЬКО через драйвер (это единственный пользовательский интерфейс в данном случае), именно драйвер в большей степени определяет удобство сканирования. Поэтому еще до покупки сканера имеет смысл ознакомиться не только с характеристиками сканера, но и с возможностями его драйвера (например, на сайте производителя).
Часто у пользователя-новичка есть возможность,
что называется, довериться программе
сканирования. Например, драйвер VistaScan сканеров UMAX предлагает 2 окна настроек: Beginner
и Advanced. Причем если второе дает возможность
задать все режимы самому, то новичку
достаточно лишь выбрать в окне Beginner тип
изображения (Color Photo, Text/LineArt, Printed Matter, Web
Image), а остальное программа сделает сама.
В окне Advanced можно выбрать помимо режима
сканирования один из встроенных фильтров:
несколько уровней Descreen (удаление печатного
растра) и маскирование нерезкости.
- PhotoMaker - драйвер компании NeuHaus - достаточно путанный и непредсказуемый.
Например, если в строке выбора типа оригинала
вы отметите «catalog», то независимо от вашего желания
включится режим автокомпенсации яркости и контраста, если «slide» или «film», то режим
увеличения яркости, а если «text», то режим увеличения контраста.
Однако чтобы не получить неожиданно неправдоподобного
результата, лучше выбирать «Photo»! Если не хотите ошибиться,
внимательно изучите сначала прилагаемую
в комплекте дискетку с подробным руководством
к драйверу (она на русском языке, что просто
замечательно!). Правда, там не упоминаются
некоторые нюансы драйвера, например,
возможность регулировки значений Brightness и Contrast существует, но она настолько грубая, что пользоваться ею просто невозможно...
- Окно Setting драйвера ScanWizard (сканеры Microtek, NeuHaus Sprint 3) пестреет на экране всевозможными
кнопочками, галочками, стрелочками, движками,
вложенными меню, встроенными фильтрами...
В общем, «куда ни ткни» - тут как тут дополнительное
окно настроек. Правда, несмотря на такую
хаотичность интерфейса, он весьма широко
представляет возможность настроек (регулировку
тона, насыщенности цветов, баланса светов
и теней, гамма-коррекцию, содержит наиболее популярные встроенные фильтры). Есть возможность автоконтраста и автокоррекции цвета.
- FotoSnap - простая и удобная программа фирмы Agfa. Если вам захочется добиться особенных результатов, то вы можете воспользоваться программой FotoLook (в старой комплектации они обе входили в предлагаемый набор программ даже к младшим моделям). Она позволяет проводить все мыслимые коррекции и настройки, причем на профессиональном уровне.
- ScanWise - это драйвер фирмы Agfa, который
теперь поставляется вместо FotoSnap и FotoLook с новыми младшими моделями
сканеров Agfa (линейка SnapScan). Позволяет
выбрать размеры, разрешение, масштаб
образа, тип оригинала, Image control (яркость, контраст, насыщенность), сканировать в пакетном режиме, посылать образ в файл, на принтер или в приложение, предлагает другие дополнительные функции.
- Драйвер сканеров Hewlett Packard PrecisionScan II позволяет
задавать только самые необходимые параметры.
Разрешение, тип изображения, фильтр Descreen. Можно сканировать изображение и сразу автоматически переводить его в электронный формат различных приложений Windows, сохраняя при этом размеры оригинала. Перед разработчиками стояла цель максимально облегчить процесс сканирования для наибольшей автоматизации работы. Новая модель ЗЗООС позволяет проводить сканирование и копирование текстов (а для 4200С также отправку документов по электронной почте) одним нажатием на кнопку.
- CanoCraft - сканер фирмы Canon - имеет приятный интерфейс
и достаточное количество возможностей
по настройке. Есть вкладка «Easy Adjust Mode», где можно выбрать больше
(или меньше) красного, зеленого, синего,
темнее (светлее) света, тени или полутона;
практически это аналог функции Varations в Photoshop. Есть вкладка «Expert Adjust Mode», где осуществляются более
тонкие настройки яркости, контраста
и т. п.
- Драйвер Epson Perfection Scan!ll имеет очень мало настроек:
тип изображения, разрешение и фильтры descreen и unsharp mask. Можно сканировать в одном из двух режимов: быстром или качественном.
- Драйвер сканеров Mustek имеет приятный и наглядный
интерфейс, все основные настройки собраны
во вкладке Main. Предлагает большой набор фильтров (Blur, Sharpen, Invert, Flip, Emboss, Unsharp Mask), а также такие дополнительные настройки, как brightness, contrast и gamma (в том числе отдельно по трем каналам), пакетный режим сканирования. С помощью окон Original и Sample можно легко сравнить исходное изображение, полученное в результате пресканирования, с конечным результатом, учитывающим установленные настройки.
HP ScanJet 6300C/ 6350С/ 6390С
Цветной/монохромный
планшетный сканер
- СКАНИРОВАНИЕ: оптическое разрешение 1200х2400 dpi, интерполяционное - неограниченное (до 99999 dpi). Макс. формат непрозрачного оригинала: 216х297 мм / 216х356 мм с ADF. Глубина цвета: цветной режим - 36 бит, полутоновый -12 бит, черно-белый - 1 бит. Динамический диапазон не заявлен. Время сканирования: около 60 сек. для фото 10х15, около 1 мин. для страницы текста, около 50 сек. для ч/б графики. Интерфейс: USB, SCSI-11. Источник света: флуоресцентная лампа белого цвета с холодным катодом. Приемнаясистема: CCD-матрица.
- АППАРАТНЫЕ ТРЕБОВАНИЯ: ПК с процессором Pentium (и выше) или эквивалентным, Windows'98 (для USB) или Windows'9-xx/NT 4.0, порт USB или SCSI, не менее 32 Мб RAM, CD-ROM, не менее 40 Мб на НО для ПО сканирования (80 Мб для полного комплекта ПО).
- ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ: программа сканирования
HP Precition-Scan Pro с встроенной функцией OCR Caere OmniPage, HP PrecisionScanLAN для сетевой работы, утилита копирования HP ScanJet Copy Utility, графический редактор Adobe PhotoDeluxe 3.0 BusinessEdition, Adobe PageMill для создания Web-страниц, HP Intelligent Assistant.
- ДОПОЛНИТЕЛЬНО: автоподатчик документов ADF (к 6300C).
- В КОМПЛЕКСЕ: автоподатчик документов ADF (к 6350С), пассивный адаптер для слайдов 35 мм, адаптер для сканирования негативов 12,7х12,7 см (к 6390С).