Иллюстрированный самоучитель по Adobe Premiere Pro 1.5

Общие сведения о цифровом видео

Звук

Посвятим данный раздел объяснению основных моментов возникновения, распространения и восприятия человеком звука, а также главным параметрам, связанным с представлением цифровой аудиоинформации.

Что такое звук?

С физической точки зрения, звук, в широком смысле этого слова, представляет собой колебания частиц окружающей среды (воздуха), передающиеся от точки к точке. Процесс распространения звука (в несколько упрощенном виде) происходит следующим образом. Некоторый источник (например, струна музыкального инструмента, мембрана динамика акустической системы или т. п.) совершает быстрые колебания с определенной частотой и амплитудой. Частотой называется количество повторений цикла колебаний в секунду, а амплитудой – максимальное отклонение колеблющегося тела от среднего состояния, измеряемое, например, в миллиметрах.

В результате взаимодействия источника звука с окружающим воздухом частицы воздуха начинают сжиматься и расширяться в такт (или "почти в такт") с движениями источника звука. Затем, в силу свойств воздуха как текучей среды, происходит передача колебаний от одних частиц воздуха другим.

В результате колебания передаются по воздуху на расстояние, т. е. в воздухе распространяется звуковая или акустическая волна, или, попросту, звук. Звук, достигая уха человека, в свою очередь, возбуждает колебания его чувствительных участков, которые воспринимаются нами в виде речи, музыки, шума и т. д. (в зависимости от свойств звука, продиктованных характером его источника).

Чем больше амплитуда колебаний источника, тем больше интенсивность возбуждаемых им звуковых волн (т. е. значение локальных сжатий и разрежений воздуха, происходящих в звуковой волне), следовательно, тем громче звук, воспринимаемый нашими органами слуха. Интенсивность звука в технике принято измерять в децибелах, сокращенно дБ (dB). Зависимость интенсивности звука от времени является исчерпывающей информации об этом звуке.

Частота звука, как уже было сказано, измеряется в единицах в секунду – в герцах, сокращенно Гц (Hz). Частота определяет высоту тона, воспринимаемую нашим ухом. Малые, или низкие, частоты (порядка сотен герц) связаны в нашем сознании с глухими басами, а большие, или высокие, частоты (десятки тысяч герц) – с пронзительным свистом. Таким образом, человеческий слух способен воспринимать звук от сотен до десятков тысяч герц, а более низкие и более высокие, чем порог слышимости, частоты называются соответственно инфразвуком и ультразвуком.

Примечание
В отношении звуковых волн часто используются производные единицы частоты – килогерц (кГц), равная 1000 Гц и, реже, мегагерц (МГц), равная 106 Гц. Чтобы не запутаться, имейте в виду, что мегагерцы, описывающие быстродействие компьютеров, никакого отношения к звуку не имеют (они определяют частоту электрических колебаний в процессоре)
.

На самом деле, подавляющее большинство знакомых нам звуков не является колебаниями определенной частоты, а представляют собой смесь различных частот, или спектр. Однако некоторые частоты в спектре, чаще всего, доминируют, определяя наше общее впечатление от звука, который мы слышим.

Итак, звук является акустическими волнами, передаваемыми в воздухе, и его основными характеристиками являются частота и интенсивность, а полноценной записью звуковых волн может быть признан временной график интенсивности.

Частота дискретизации

Очевидно, что для записи звука на компьютере требуется представить в цифровом виде график зависимости интенсивности звука от времени. Для этого достаточно записать в аудиофайл последовательные значения интенсивности звука, измеренные через определенные (чаще всего, равные) промежутки времени. Чем чаще будет произведена такая запись, тем большая информация о звуке будет сохранена, и, соответственно, тем лучше и естественнее будет передан при помощи компьютера звук, однако тем большим по размеру получится звуковой файл.

Итак, частотой дискретизации (rate) называется частота записи графика интенсивности, при помощи которой звук представляется в цифровом виде. Например, частота 5000 Гц означает, что каждая запись звука производится через временные интервалы 1 / 5000 = 0.0002 с.

Очевидно, что частота дискретизации для звуковых файлов имеет то же значение, что и разрешение для видеофайлов.

Глубина кодировки звука (формат)

Подобно действию рассмотренного нами ранее для видеофайлов параметра глубины пиксела, в аудиофайлах каждое текущее значение интенсивности звука может быть кодировано с использованием различного числа возможных градаций. Таким образом, глубина кодировки звука определяет количество битов информации, кодирующих интенсивность звуковой волны в каждый момент времени. Очевидно, что, чем больше количество записываемых в звуковой файл битов, тем с лучшей точностью и разрешением по интенсивности прописывается в цифровом виде звук, тем лучше и естественнее качество звучания.

Поясним сказанное на простом примере. Рассмотрим малый интервал времени, для которого имеется несколько измеренных значений интенсивности (для определенных отсчетов времени с равными промежутками). Эти значения интенсивности обозначены на рисунке крестиками. Если использовать высокую глубину кодировки, то при помощи достаточного числа бит информации можно записать в звуковой файл данные значения интенсивности с большой точностью. Однако, в целях уменьшения размера файла, глубина кодировки может быть уменьшена. Это означает, что имеющееся в распоряжении компьютера число бит информации будет недостаточным, чтобы записать точные значения интенсивности, а вместо них в файл будут записаны наиболее близкие допустимые значения. Разумеется, из-за отличий в исходном звуковом сигнале и записанной в аудиофайл информации качество воспроизведения звука во втором случае будет гораздо худшим. Подчеркнем, что в обоих случаях использовалось одинаковое значение частоты дискретизации.

Моно и стерео

Упомянем о хорошо известном всем стереофоническом эффекте, позволяющем синхронно воспроизводить из двух различных динамиков различный звук. Как известно, формат Моно связан с записью в аудиофайл одной звуковой дорожки, а формат Стерео – двух (в последнем случае размер файла по сравнению с монофоническим удваивается благодаря записи в один аудиофайл двух зависимостей интенсивности звука от времени).

В последнее время все более широкую популярность приобретают многоканальные стереофонические эффекты (предусматривающие воспроизведение не двух, а большего числа звуковых каналов, что, естественно, в соответствующее число раз увеличивает размеры файлов). В этом случае важную роль приобретает схема расстановки динамиков относительно слушателя, поскольку многоканальная стереофония позволяет создать полноценный "эффект присутствия" (хорошим примером является стандарт Dolby Surround, применяемый в современном кинематографе).

Качество (компрессия)

Чем больше частота дискретизации и глубина кодировки звука, тем качественнее результат воспроизведения аудиофайла, но и, к сожалению, тем больше его физический размер. Для уменьшения размеров звуковых файлов применяются специальные программы, называемые (как и в случае видеофайлов) компрессорами, или кодеками (codec). Процедуру уменьшения размера звукового файла также называют компрессией, или аудиосжатием. В последнее время (в основном, благодаря широко известному формату МР3) появились новые, попросту фантастические, возможности чрезвычайно эффективно сжимать звуковые файлы, оставляя их качество очень хорошим. Эти технологии постоянно совершенствуются, с каждым годом открывая для пользователей все более широкие возможности.

Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.