Автор работы: Пользователь скрыл имя, 28 Апреля 2014 в 09:29, курсовая работа
Цель настоящей работы – провести обзор исследований в области баз данных и информационных ресурсов рассмотреть возможности их использования.
Задачи:
• Рассмотреть лингвистику как объект информационного отражения, определив те ее черты, которые обуславливают особенности и состав информационных ресурсов в этой области.
• Изучить историю развития БД выделить и охарактеризовать основные возможности, функции и преимущества.
- В грамматике (для определения частоты употребления грамматических морфем в текстах различного типа, выявления наиболее употребляемых типов словосочетаний и предложений, определения значений синонимичных морфологических единиц, частоты употребления классов слов и т.д.).
- В лингвистике текста (для дифференциации типов текста, создания конкордансов, выявления связи между предложениями в абзацах и между абзацами «т.д.).
- При автоматическом переводе текстов (для поиска контекстов слов, имеющих несколько переводных эквивалентов, поиска переводных эквивалентов терминологических и фразеологических словосочетаний в параллельных текстах и т.д.).
- В учебных целях (для выбора цитат, отдельных фрагментов произведений, примеров, используемых в процессе создания учебников и учебных пособий. б) таггированные корпусы текстов (от англ, tag — ‘индекс, помета’). Все слова такого корпуса получают некоторые буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические или структурные признаки. Таких индексов может быть несколько.
3) Фонетические
В настоящее время общепринято, что для создания машиночитаемых фонетических корпусов используется транскрипция на основе орфографического представления звуков речи с дополнительными знаками, передающими (при необходимости) просодические, паралингвистические и другие особенности произношения. а) Фонетические корпусы текстов широко используются для решения следующих задач:
- сопоставительного изучения устной и письменной форм языка;
- изучения грамматических и лексических особенностей устной речи;
- исследования фонетических особенностей диалектов;
- построения частотных списков фонем и их сочетаний;
- изучения акустических свойств речевых единиц и их использования в психолингвистических и лингвистических экспериментах;
- создания компьютерных систем, распознавания и синтеза устной речи.[ Михайлов: 1976,7]
ЗАКЛЮЧЕНИЕ
База данных не является понятием собственно лингвистики. Это понятие общее для всех информационных технологий. База данных – это структурированная совокупность взаимосвязанных данных в рамках некоторой предметной области, предназначенная для длительного хранения во внешней (не оперативной) памяти компьютера и постоянного применения. Тем не менее создание базы данных – ключевая технология компьютерной лексикографии. Современные словари создаются на основе хранимых в памяти компьютера контекстов, для их создания используют программы, позволяющие формальным образом представить морфологические, словообразовательные, синтаксические и даже семантические характеристики слова.
Знания, которые необходимо усвоить в филологических вузах, в большом количестве содержаться на магнитных носителях и в сети интернет.
Преимущества использования БД :
Рассмотрим, какие преимущества получает пользователь при использовании БД как безбумажной технологии:
· Компактность (Информация хранится в БД, нет необходимости хранить многотомные бумажные картотеки)
·Скорость (Скорость обработки информации (поиск, внесение изменений) компьютером намного выше ручной обработки)
· Низкие трудозатраты (Нет необходимости в утомительной ручной работе над данными)
· применимость (Всегда доступна свежая информация)
Дополнительные преимущества появляются
при использовании БД в многопользовательской
среде, поскольку становится возможным
осуществлять централизованное управление
данными. Современные системы управления
базами данных обеспечивают как физическую
(независимость от способа хранения и
метода доступа), так и логическую независимость
данных (возможность изменения одного
приложения без изменения остальных приложений,
работающих с этими же данными). Современные
СУБД дают возможность включать в них не
только текстовую и графическую информацию,
но и звуковые фрагменты и даже видеоклипы.
Простота использования СУБД позволяет
создавать новые базы данных, не прибегая
к программированию, а пользуясь только
встроенными функциями. СУБД обеспечивают
правильность, полноту и непротиворечивость
данных, а также удобный доступ к ним.
Популярные СУБД - FoxPro, Access for Windows, Paradox. Для
менее сложных применений вместо СУБД
используются информационно-
· хранение большого объема информации;
· быстрый поиск требуемой информации;
· добавление, удаление и изменение хранимой информации;
· вывод ее в удобном для человека виде.
В работе показано соотношение между общепринятыми понятиями «база данных», «система управления базами данных» и современными «лингвистическими информационными ресурсами». Достаточно подробно представлены пути поиска и извлечения таких знаний.
Выполнены все поставленные задачи, такие как:
СПИСОК ЛИТЕРАТУРЫ
Информация о работе Базы данных и лингвистические информационные ресурсы