Компьютерные переводчики

Автор работы: Пользователь скрыл имя, 04 Ноября 2013 в 10:47, реферат

Краткое описание

Предметом исследования являются стилистические, грамматические и семантические особенности машинного перевода. Сегодня программы-переводчики умеют строить осмысленные фразы, и за последние несколько лет качество перевода улучшилось. Однако компьютер еще плохо разбирается в грамматических нюансах и жаргоне, поэтому его главное назначение – переводы деловых бумаг, руководств, писем из электронной почты, страничек из Internet (Web-страниц). Целью исследования является выявление , изучение и анализ особенностей машинного перевода.

Содержание

Введение
I Глава «Теоретические основы машинного перевода»
1. Искусство перевода
2. Значение перевода
3. История развития машинного перевода
4. Электронные словари
1.4.1. Классификация электронных словарей
5. Анализ машинного перевода
6. Основные проблемы программ машинного перевода
1. 1.6.1. Словарь
2. Грамматика
6. Виды программ машинного перевода
1.7.1. Офисный переводчик
2. Домашний переводчик
3. Машинный перевод в Internet
7. Преимущества программ – переводчиков
8. Практические советы
Вывод по I Главе « Теоретические основы машинного перевода»
II Глава « Практическое применение программ машинного перевода"
Вывод по II Главе «Практическое применение программ машинного перевода»
Заключение
Список литературы

Вложенные файлы: 1 файл

КОМПЬЮТЕРНЫЕ ПЕРЕВОДЧИКИ.docx

— 82.94 Кб (Скачать файл)

   Перевод имеет долгую  историю. Своими корнями он  восходит к тем далеким временам, когда праязык начал распадаться  на отдельные языки и возникла  необходимость в людях, знавших  несколько языков и способных  выступать в роли посредников  при общении представителей разных  языковых общин.

 С самого начала перевод  выполнял важнейшую социальную  функцию, делая возможным межъязыковое  общение людей. Распространение  письменных переводов открыло  людям широкий доступ к культурным  достижениям других народов, сделало  возможным взаимодействие и взаимообогащение  литератур и культур[6].

   По свидетельству биографов,  еще выдающийся математик XIX века  Чарльз Бэббидж пытался убедить  британское правительство в необходимости  финансировать его исследования  по разработке “вычислительной  машины”. В числе прочих благ  он обещал, что когда-нибудь эта  машина сможет автоматически  переводить разговорную речь. Но, хотя сегодня Бэббидж и считается  признанным автором множества  идей, лежащих в основе работы  компьютера, он так и не сумел ни построить свою машину, ни выполнить обещания по поводу МП. И сегодня эта идея по-прежнему остается в значительной степени нереализованной. Однако в последнее время благодаря появлению Internet как платформы глобальной связи она вновь начала привлекать широкое внимание и инвестиции[7].

   Вообще, первые программы  МП появились в 50-х годах,  всего несколько лет спустя  после рождения компьютера, но  до широкого распространения  ПК МП был скорее интересным  объектом научных исследований, чем важной сферой использования  вычислительной техники, по двум  причинам: дороговизна времени работы  компьютера и коллективное пользование  его ресурсами. Последнее обстоятельство  часто не позволяло немедленно  обратиться к электронному помощнику,  сводя на нет важнейшее преимущество  МП перед обычным – его оперативность.

   Датой рождения МП (как  области исследований) принято считать  1947 г., и все началось с письма  Уоррена Уивера, директора отделения естественных наук Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то время уже стала выполняться на электромеханических устройствах. За этим письмом последовало множество дискуссий, появился меморандум о целях, и наконец, были выделены средства на исследования. И в 1952 г. состоялась первая конференция, организованная знаменитым математиком Бар-Хиллелем, на которой исследователи обменялись мыслями относительно организации множества синтаксических правил языка, способов описания семантики, морфологических структур, структуры словарей для систем перевода. Достижения в академических исследованиях стимулировали коммерческий интерес к проблеме МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г. сумела показать первую систему, базирующуюся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений. Этот эксперимент положил начало исследовательскому буму: в следующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн. долларов.

   И только с начала 80-х  годов, когда ПК уверенно и  мощно начали завоевывать мир,  время их работы, естественно,  подешевело и доступ к ним можно было получить в любую минуту. А значит, МП наконец-то стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов, однако некоторые проблемы МП остались нерешенными и по сей день.

   90-е годы можно считать  подлинной эпохой возрождения  в развитии МП, что связано  не только с высоким уровнем  возможностей персональных компьютеров,  появлением сканеров и программ OCR, но и с распространением  Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП. Он вновь стал привлекательной областью вложения капиталов как для частных инвесторов, так и для государственных структур.

   И хотя технологии МП  по-прежнему страдают множеством  недостатков, многие организации  вновь стали серьезно относиться  к обещанию Бэббиджа. “Машинный  перевод все еще далек от  совершенства, но любой желающий  с его помощью сможет, по крайней  мере, понять основной смысл документа”, — считает Луи Монье, технологический директор Alta Vista, крупного поискового Web-узла, который начал эксперимент с МП в онлайновом режиме.

   Проблема МП рассматривается  как ключевая в вопросах продвижении  высоких технологий и обеспечении  конкурентоспособности США в  глобальном информационном пространстве[9].

   XXI век ставит новые задачи  в информационном пространстве  человечества. Благодаря массовой  информации роль перевода в  жизни человечества неуклонно  возрастает. Сегодня переводческие  связи охватывают почти все  сферы человеческой деятельности. Движение информационных потоков  не знает ни границ, ни времени,  ни пространства.

   Бесконечное разнообразие  современного мира передается  при помощи средств информации  в ощущениях и интерпретациях  многочисленных участников международного  информационного процесса - журналистов,  корреспондентов, комментаторов,  телеоператоров. Поэтому постоянно  растет значение переводческой  деятельности, и вместе с ними  возникают и переводческие проблемы. Обострение языковых проблем  диктует поиск новых решений.  Если раньше переводческая деятельность  рассматривалась только в связи  с переводом художественной литературы, то сегодня все более важное  место - и по объему, и по  социальной значимости - стали занимать  переводы текстов специального  характера - информационные, экономические,  юридические, технические и рекламы.

   Развитие кибернетики сделало  возможным машинный перевод, т.е.  перевод, строящийся на использовании  машиной определенных и постоянных  для данного вида материала  соответствий между словами и  грамматическими явлениями разных  языков. В настоящее время имеется  достаточно широкий выбор пакетов  программ, облегчающих труд переводчика.

 

1.4. Электронные словари

  Электронные словари начали разрабатываться значительно раньше, чем альтернативные им системы машинного перевода, поэтому в настоящее время на рынке программного обеспечения имеется чрезвычайно широкий выбор словарей - от самых простейших (например, DIC) до мощных систем, объединяющих в одной программной оболочке несколько лексических баз данных - специализированных тематических словарей, последовательность подключения которых определяется пользователем (LINGVO). Выбор того или иного программного продукта зависит исключительно от аппаратных возможностей компьютера, которым располагает пользователь, финансовых соображений и конкретных условий, в которых работает переводчик.

   Потенциальную аудиторию  этих программ можно определить  совершенно точно - это учащиеся  и студенты, использующие словарь  как одно из пособий при  изучении иностранного языка,  а также домашние и бизнес - пользователи, которым нужен универсальный  и простой в применении словарь-справочник  для эпизодического перевода  деловых бумаг и корреспонденции.

   Ниже представлена классификация  электронных словарей по их  основным техническим и эксплуатационным  характеристикам. Всю совокупность  электронных словарей можно подразделить  по следующим критериям[35].

  1.4.1. Классификация электронных словарей

 По используемой операционной  системе

  Наиболее простые электронные  словари (DIC) работают под управлением  ОС MS-DOS, начиная с версий 2.21 и 3.30, что позволяет их использовать  практически на любых IBM-совместимых  персональных компьютерах, включая  XT, АТ-286. Наиболее сложные многооконные  и многофункциональные электронные  словари, позволяющие в одной  оболочке подключать различные  тематические базы данных, работают  под управлением ОС WINDOWS 3.11, WINDOWS NT, WINDOWS 95 и т.д. Естественно, что  для их успешного функционирования  необходим более мощный компьютер  (типа AT-486DX) с оперативной памятью  не менее 8 МБ.

 

 По способу загрузки

      Можно подразделить на нерезидентные и резидентные. К первым относятся простейшие программы (например, подстрочечный словарь DIC), которые работают только в собственной среде и не вызываются из других оболочек, например из текстовых редакторов. В большинстве случаев они функционируют в режиме автоматического ("пакетного") перевода. Вторые загружают свое ядро в оперативную память компьютера (например, "LINGVO for DOS") и могут вызываться в любой момент работы компьютера, например из любого текстового редактора, при помощи нажатия комбинации "горячих клавиш" - клавиш оперативного вызова. Эти словари обеспечивают работу переводчика в интерактивном режиме.

 

 По количеству подключаемых  словарных баз (словарей)

   Ранние версии электронных  словарей позволяли подключать  только один словарь. Современные  программы, например "Система  электронных словарей LINGVO", независимо  от того в какой ОС они  работают, позволяют подключать  до нескольких десятков словарных  баз и устанавливать приоритет  последних.

 По возможностям расширения  словарной базы

   Устаревшие электронные словари не имели возможности расширения словарных баз пользователем, современные версии, например LINGVO 4.6 и выше, имеют специальные утилиты для создания пользователем собственных и расширения существующих словарей.

По режиму перевода

    Можно выделить два основных режима перевода: автоматический пакетный (подстрочечный) и интерактивный (режим "запрос - ответ"). В первом случае программа вызывается с указанием имени текстового файла, который необходимо перевести, или маски для целой группы текстовых файлов, предназначенных для перевода. Далее автоматически, без участия переводчика, производится прямой перевод каждого отдельного слова с выводом на экран монитора или на печатающее устройство только переведенных слов или исходного текста, под каждым переведенным словом которого будет стоять его значение на русском языке, под теми словами, которых не оказалось в ЭС обычно ставится знак "?". Такой режим называется подстрочечным. Словарные базы подобных электронных словарях весьма ограниченны, качество перевода оставляет желать лучшего. Подобные программные продукты вряд ли смогут оказать помощь профессиональному переводчику. Во втором случае программа работает следующим образом. После загрузки резидентной части программы в оперативную память компьютера, пользователь, работая, например, в текстовом редакторе либо непосредственно в оболочке словаря, вводит с клавиатуры неизвестное слово на языке оригинала, а затем, выделив его, чаще при помощи "мыши", нажатием комбинации "горячих клавиш" активизирует электронный словарь, который заменяет текст оригинала на русскоязычный перевод. Время доступа к переводу составляет примерно 0,2 секунды, что значительно ускоряет работу переводчика. Именно такие электронные словари, с учетом возможности расширения и одновременного подключения нескольких словарных баз, могут значительно облегчить и ускорить работу переводчика любого уровня профессионализма.

 

   В любом случае, бум, связанный  с появлением простейших электронных  словарей, позволяющих относительно  быстро произвести поиск того  или иного слова, уже в прошлом.  С развитием технологии систем OCR, о которых было упомянуто  раньше, стали разрабатываться автоматизированные  системы машинного перевода[8].

 

1.5. Анализ машинного перевода

 При работе с данным программными продуктами в виде электронных переводчиков обнаруживается ряд погрешностей при переводе текста. Лексические анализы переведенных текстов показали, что по большей части электронные переводчики адекватно переводят простые части речи, но допускают ошибки в переводе падежей, принадлежности прилагательных, речевых оборотов, построения предложения.

   Недостатком некоторых переводчиков  является неточность перевода  слов, имеющих несколько значений. Для более адекватного перевода  в перспективе можно предложить  более глубокий эвристический  анализ грамматического построения  предложения, с улучшением качества  перевода различных частей речи  и их грамматических характеристик,  а так же исключить конфликт  словарей при переводе специализированных  текстов.

   Грамматический анализ текстов  показывает, что электронный переводчик  справляется с переводом слов  во множественном и единственном  числе, но имеется определенная  трудность в переводе падежей  и постановки глаголов в нужное  число. Это объясняется различной  интерпретацией падежей в русском  и английском языках: в русском  – через окончание, в английском  – через предлоги.

   Итак, компьютер пока во  многом не может заменить переводчика.  Стоит ли тогда вообще применять  системы машинного перевода? Конечно,  стоит. Если компьютер используется  для перевода литературных текстов,  то получается черновой вариант  текста, так называемый подстрочник,  который превращается в произведение  искусства человеком, слабо владеющим  языком оригинала, но являющимся  хорошим литературным редактором. Если же речь идет о переводе  технических текстов, то здесь  при правильном выборе словаря  по специальности, в рамках  которой написан текст, получается  вполне удовлетворительный результат,  иногда не требующий последующего  вмешательства. Вообще необходимость  редактирования компьютерного перевода очень часто возникает в связи с проблемами, перечисленными выше. Для этого системы машинного перевода обязательно имеют средства редактирования текстов. Для некоторых заказчиков такой уровень перевода просто неприемлем. “Машинный перевод — это миф, — считает Линн Сешедри, консультант одной из служб корпорации Electronic Data Systems (Плейно, шт. Техас), принимавший участие в создании глобальной интрасети компании. — Возможно, он годится для технической документации, но во всех остальных случаях вы получаете 15% смысла и 85% ерунды”. Для перевода содержания своей интрасети EDS пользуется услугами профессиональных переводчиков на контрактной основе. Однако других машинный перевод вполне устраивает, в значительной степени потому, что часто ему просто нет реальных альтернатив. Парижский фонд “За развитие гуманизма” (FPH) в свое время также стоял перед выбором: тратить ли существенную часть своего бюджета на переводчиков или испробовать средства машинного перевода. Эта организация, финансируемая из частных источников, выпускает доклады по экологии, экономике и ряду других областей, привлекая для их создания интернациональные коллективы ученых. Ее выбор пал на технологию машинного перевода, а точнее, на продукт фирмы Globalink, представляющий собой вполне качественное и недорогое приложение для ПК. FPH установил его на сервер электронной почты, чтобы общение специалистов, говорящих на разных языках, было проще и эффективнее.

Информация о работе Компьютерные переводчики