Кодирование звуковой информации

Автор работы: Пользователь скрыл имя, 21 Декабря 2013 в 16:57, реферат

Краткое описание

В основе кодирования звука с использованием персонального компьютера лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (например, редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты и разрешения (глубины кодирования звука, количества уровней) дискретизации.

Содержание

Введение
1. Принципы оцифровки звука
1.2. Линейное (однородное) квантование амплитуды
1.3. Другие способы оцифровки
1.4. Аналогово-цифровые преобразователи (АЦП)
2. Кодирование оцифрованного звука перед его записью на носитель
2.1. Терминология
2.2. Некоторые форматы оцифровки звука в сравнении
3. Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя
3.1. Принцип действия ЦАП
4. Методы кодирования
4.1. Частотная модуляция
4.2. Таблично-волновой синтез
Заключение
Список используемой литературы

Вложенные файлы: 1 файл

Кодирование звуковой информации.doc

— 274.50 Кб (Скачать файл)

 

Введение

В основе кодирования  звука с использованием персонального  компьютера лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (например, редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты и разрешения (глубины кодирования звука, количества уровней) дискретизации.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Принципы оцифровки звука

Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.

Оцифровка звука — это технология поделенным временным шагом и последующей записи полученных значений в численном виде. 
Другое название оцифровки звука — аналогово-цифровое преобразование звука.

Оцифровка звука  включает в себя два процесса:

1) процесс дискретизации (осуществление выборки) сигнала по времени;

2)процесс квантования по амплитуде.

1.1. Дискретизация по времени

 

Рисунок 1 - Пример представления аналогового сигнала в цифровой форме

Процесс дискретизации по времени — это процесс получения значений сигнала, который преобразуется, с определенным временным шагом — шагом дискретизации. Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизации или частотой выборки (или частотой семплирования). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено. Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона). Согласно этой теории, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором наивысшая частота спектра равна Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fвыполняется: Fd>2Fm. На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (0 — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен). Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.

1.2. Линейное (однородное) квантование амплитуды

Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N-битного слова можно описать 2разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2N−1 равных промежутков, разделив его на 2уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — это процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, то квантование называют линейным или однородным. 
Точность округления зависит от выбранного количества (2N) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа называют отсчетами или семплами. Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала, то  есть дискретизация сигнала во времени в совокупности с методом однородного квантования, называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation, сокращенно PCM). Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

1.3. Другие способы оцифровки

Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ неоднородного квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды, при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования. Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией или неоднородной ИКМ (англ. Nonuniform PCM).

Альтернативным  способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция - разностная ИКМ (англ. Differential PCM или DPCM). В случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов.

1.4. Аналогово-цифровые преобразователи (АЦП)

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП). Это преобразование включает в себя следующие операции:

1) ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации;

2) дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения;

3) квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования;

4) кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

Делается это  следующим образом: непрерывный  аналоговый сигнал «режется» на участки с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Кодирование оцифрованного звука перед его записью на носитель

Для хранения цифрового  звука существует много различных  способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени. Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел - значений амплитуды. В этом случае существуют два способа хранения информации.

Первый - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) – это способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. В таком виде записаны данные на всех аудио CD.

Второй - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – это запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Можно сжать  данные так, чтобы они занимали меньший  объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.

1) Кодирование данных без потерь (lossless coding) – это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом позволяют обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.

2) Кодирование данных с потерями (lossy coding). Здесь цель состоит в том, чтобы добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путем использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психо-акустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» - сильное сжатие достигается путем «воинственного упрощения», когда кодером игнорируются множественные нюансы. Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания.

2.1. Терминология

Кодер – это программа или устройство, реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.

Декодер – это программа или устройство, которая реализует обратное преобразование закодированного сигнала в декодированный.

Кодек – это программный или аппаратный блок, предназначенный для кодирования и декодирования данных.

Наиболее распространёнными  кодеками являются:

а) MP3 – MPEG-1 Layer 3;

б) WMA – Windows Media Audio;

в) Стандарт MPEG-2 AAC;

г) Стандарт MPEG-4 AAC.

 

2.2. Некоторые форматы оцифровки звука в сравнении

Таблица 1 - Сравнение звуковых форматов

Название  формата

Квантование, бит

Частота дискретизации, кГц

Число каналов

Величина потока данных с диска, кбит/с

Степень сжатия/упаковки

CD

16

44,1

2

1411,2

1:1 без потерь

Dolby Digital (AC3)

16-24

48

6

до 640

~12:1 с потерями

DTS

20-24

48; 96

до 8

до 1536

~3:1 с потерями

DVD-Audio

16, 20, 24

44,1; 48; 88,2; 96

6

6912

2:1 без потерь

DVD-Audio

16, 20, 24

176,4; 192

2

4608

2:1 без потерь

MP3

плавающий

до 48

2

до 320

~11:1 с потерями

AAC

плавающий

до 96

до 48

до 529

с потерями

AAC+ (SBR)

плавающий

до 48

2

до 320

с потерями

Ogg Vorbis

до 32

до 192

до 255

до 1000

с потерями

WMA

до 24

до 96

до 8

до 768

2:1, есть версия  без потерь

Информация о работе Кодирование звуковой информации