Кодирование звуковой информации
Звук
- Звук представляет собой распространяющуюся чаще всего в воздухе, воде или другой среде волну с непрерывно изменяющейся интенсивностью и частотой.
- Человек может воспринимать звуковые волны (колебания воздуха) с помощью слуха в форме звука различая при этом громкость и тон.
- Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука.
Зависимость громкости, а
также высоты тона звука от
интенсивности и частоты звуковой
волны.
Чтобы измерять громкость
звука применяют специальную
единицу "децибел" (дБ)
Характерный звук
Громкость, измеренная в децибелах
Нижний предел чувствительности
человеческого уха
0
Шорох листьев
10
Разговор
60
Гудок автомобиля
90
Реактивный двигатель
120
Болевой порог
140
Преобразование непрерывного
звукового сигнала в цифровую
дискретную форму.
Качество оцифрованного
звука
- Частота дискретизации звука, гц - это количество измерений громкости звука за одну секунду.
- Герц (обозначается Гц или Hz) — единица измерения частоты периодических процессов (например колебаний).
1 Гц означает одно исполнение такого процесса за одну секунду: 1 Гц= 1/с.
- Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитывать по общей формуле N = 2I.
7
MP3 - (формат кодирования звуковой
дорожки MPEG) — лицензируемый формат файла для хранения
аудио-информации.
Вообще то, формат .МР3 основан на
обмане человеческого уха.
Человеческому слуху свойственно
адаптироваться к появлению новых
звуков, что выражается в повышении
порога слышимости. Поэтому одни
звуки способны маскировать (то
есть, делать субъективно неслышимыми)
другие.
Вот и в этом формате часть звуков,
которые, как считает соответствующая
теория, делаются неслышимыми, просто
убираются из общего звучания. После чего получившийся «полуфабрикат»
кодируется
MIDI (англ. Musical Instrument Digital
Interface —
В отличие от других форматов,
хранит не оцифрованный звук,
а наборы команд (проигрываемые
ноты, ссылки на проигрываемые
инструменты, значения изменяемых
параметров звука), которые могут
воспроизводиться по-разному в
зависимости от устройства воспроизведения.
Удобство формата MIDI как формата
представления данных позволяет
реализовывать устройства, производящие
автоматическую аранжировку по
заданным аккордам, а также приложения
3D-визуализации звука.
Кроме того, такие файлы, как правило,
имеют на несколько порядков меньший размер,
чем оцифрованный звук сравнимого качества.
8
Качество оцифрованного
звука.
- Чем больше частота дискретизации и глубина кодирования звука, тем более качественным будет звучание оцифрованного звука и тем лучше можно приблизить оцифрованный звук к оригинальному звучанию.
- Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно").
- Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Алгоритм вычисления информационного
объема звукового файла.
- 1) выяснить, сколько всего значений считывается в память за время звучания файла;
- 2) выяснить разрядность кода (сколько бит в памяти занимает каждое измеренное значение);
- 3) перемножить результаты;
- 4) перевести результат в байты;
- 5) перевести результат в К байты;
- 6) перевести результат в М байты;
Задача № 1
Подсчитать объем файла
с 10 минутной речью записанного с частотой
дискретизации 11025 Гц и разрядностью кода
4 бита на 1 измерение. (Ответ = 3,154277
Мбайт)
Алгоритм вычисления времени
звучания файла.
- 1) Информационный объем файла перевести в К байты.
- 2) Информационный объем файла перевести в байты.
- 3) Информационный объем файла перевести в биты.
- 4) Выяснить, сколько значений всего измерялось (Информационный объем в битах поделить на разрядность кода).
- 5) Вычислить количество секунд звучания. (Предыдущий результат поделить на частоту дискретизации.)
Задача № 2
- Подсчитать время звучания звукового файла объемом 3.5 Мбайт, содержащего стереозапись с частотой дискретизации 44 100 Гц и разрядностью кода 16 бит на 1 измерение. (Ответ= 20,805 сек)