Звуковые файлы

Звуковые файлы (sound files, audio files) — файлы, содержащие цифровую запись аудиоданных (голоса, музыкальных произведений или их фрагментов и других звуков любой природы); существуют два основных типа звуковых файлов: с оцифрованным звуком и нотной записью. Звуковые файлы представляют собой составную часть мультимедиа.
Файлы с оцифрованным звуком (digitized sound files) — звуковые файлы, в которых исходная непрерывная («аналоговая») форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных («выбранных») через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling), а такую форму записи — импульсно-кодовой (pulse code). Аппаратная реализация обработки оцифрованного звука состоит в том, что аналого-цифрового преобразователь (АЦП) преобразует аналоговый сигнал в множество цифровых замеров, а при воспроизведении цифро-аналоговый преобразователь (ЦАП) осуществляет обратный процесс — преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.
Файлы с нотной записью (song file, music file) — звуковые файлы, которые содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени. Формат может предусматривать одновременную игру нескольких музыкальных инструментов, в этом случае говорят о соответствующем количестве голосов.
Редактировать

Основные стандарты многоканального звука

Dolby Stereo — стандарт на технологию цифровой записи/воспроизведения звукового сопровождения фильмов для кинотеатров, позволяет кодировать на двух звуковых дорожках кинопленки четыре канала: левый, центральный, правый и тыловой. Считанный с кинопленки сигнал преобразуется декодером в четырехканальный, дающий эффект окружающего (surround) звука. Без декодера звук воспроизводится как обычный двухканальный стерео. Стандарт предложен компанией Dolby Laboratories в 1976 году.
DDS (Dolby Surround Sound) — стандарт на технологию цифровой записи/воспроизведения звукового сопровождения фильмов в частотном диапазоне 100-7000 Гц для домашних кинотеатров. Стандарт позволяет кодировать на двух звуковых дорожках кинопленки три канала: левый, правый и тыловой. Считанный с кинопленки сигнал декодируется в трехканальный. Без декодера звук воспроизводится как обычный двухканальный стерео. Стандарт предложен компанией Dolby Laboratories в 1982 году.
DPL (Dolby Surround Pro Logic) — развитие стандарта DDS для домашних кинотеатров с трех на четыре канала звука: левый, центральный, правый и тыловой. Стандарт предложен компанией Dolby Laboratories в 1987 году.
Dolby Digital — стандарт кодирования/декодирования записи шестиканального звука (5+1) в диапазоне от 20 Гц до 20 кГц: 5 каналов окружающего звука и одним низкочастотным (сабвуферным). Стандарт предложен компанией Dolby Laboratories в 1992 году. Частотный диапазон пяти каналов составляет от 3 Гц до 20 кГц, сабвуфера — от 3 Гц до 120 кГц.
Dolby Digital AC3 — дополнение стандарта Dolby Digital схемой, обеспечивающей плотность сжатия записи звука от 12:1 и более при значении битрейта от 64 до 640 Кбит/с при высоком качестве воспроизведения.
Dolby Surround AC3 — упрощенный вариант стандарта Dolby Digital для домашних кинотеатров, отличающийся сниженными скоростями потоков данных.
DTS (Digital Theater System) — стандарт шестиканальной (5+1) записи звука на музыкальных DVD, близок к Dolby Digital, отличается меньшим коэффициентом сжатия (4:1), повышенной скоростью потока данных (битрейт — 882 Кбит/с). За счет этого, а также использования совершенного алгоритма сжатия характеризуется высоким качеством записи и воспроизведения звука. При записи используется частота дискретизации 48 кГц, что делает стандарт наиболее высококачественным из всех стандартов записи звука на DVD.
Dolby Pro Logic II — развитие стандарта Dolby Surround Pro Logic, обеспечивающее разложение обычного стереозвука на шесть каналов: 5+1.
Dolby Pro Logic Iix — развитие стандарта Dolby Surround Pro Logic, обеспечивающий разложение стереозвука на 7 (6+1) или 8 каналов (7+1). Возможны режимы декодирования: фильм (Movie) — производится дублирование центрального канала или тыловых каналов; игра (Play) — сигнал дополнительно направляется на «новые каналы»; музыка (Music).
Dolby Digital EX — вариант стандарта Dolby Pro Logic Iix для домашних кинотеатров.
Dolby Digital Surround EX — расширенный до 7 каналов (6+1) вариант стандарта Dolby Digital Surround, в котором имеется дополнительный тыловой (задний) канал, дублирующий центральный канал, если звук записан в формате 5+1. Если звук записан в формате 6+1, то дополнительный канал становится полноценным каналом окружающего звука.
DTS-ES — аналог стандарта Dolby Digital EX, разработанный компанией DTS; позволяет кодировать звук в форматах 6+1 и 7+1 и раскладывать звук, закодированный в формате DTS (5+1) на 7 (6+1) или 8 (7+1) каналов.
Редактировать

Другие форматы и аудиокодеки

AAC (Advanced Audio Coding) — цифровой формат кодирования, обеспечивающий высокое качество записи и воспроизведения музыкальных произведений. Полагают, что AAC превосходит по качеству звучания формат аудиозаписи MP3. AAC используется в стационарных, мобильных и переносных записывающих и воспроизводящих устройствах фирмы Apple (например, плейерах серии iPod).
FLAC — формат сжатия аудиофайлов без потери качества. Его особенности: многоплатформенность (возможность использования практически со всеми действующими ОС), постоянное обновление, наличие удобной графической оболочки, внешних модулей (плагинов) для разных проигрывателей, утилиты командной строки, выполняющей сжатие и распаковку файлов, а также утилиты для редактирования метаданных в файлах.
Monkey`s Audio — бесплатно распространяемый формат сжатия аудиофайлов. Его характеристики: отсутствие потерь качества, коэффициент сжатия — 40-50%, работает на платформе Windows, имеется плагин для проигрывателей Winamp, позволяет кодировать WAV-файлы с любой частотой дискретизации с 8-, 16-, или 24-битным динамическим диапазоном в моно- или стереорежиме. Аудиофайлы имеют расширение *.ape. Формат имеет открытый исходный код, что позволяет разработчикам включать поддержку этого кодека в свои программы.
OGG (Ogg Vorbis) — звуковой формат, часть проекта полностью открытой мультимедийной системы. По всем основным показателям (качество воспроизведения звукового спектра, наличие внесенных шумов, коэффициент сжатия) OGG опережает WMA на 2-30% в зависимости от типа музыки. Значения коэффициентов сжатия OGG для разных образцов тестового сигнала при битрейте 128 бит/с составляют от 6 до 12. OGG-файл записи популярной музыки при битрейте 128 кбит/с может быть в 1, 5 раза короче MP3-файла, несмотря на использование совместно с MP3 адаптивного сжатия VBR1 (Lame v.1.12, engine 3.86).
RA (Real Audio) — формат потоковой записи (последовательной и непрерывной) и/или передачи аудиоданных; распространенная система передачи звука в реальном масштабе времени через Интернет (телефонная связь, радиотрансляция). Real Audio содержит метод сжатия и одновременно протокол передачи оцифрованного звука.
SPDI/F (Sony/Philips Digital Interface Format) — формат обмена аудиоданными в цифровом виде без промежуточного преобразования в аналоговый сигнал, совместная разработка фирм Sony и Philips; обеспечивает высокое качество передачи звука.
TTA — бесплатный мультиплатформенный аудиокодек для сжатия без потерь 8-, 16- или 24-битных WAV-файлов; создан российскими разработчиками. Его характеристики: коэффициент сжатия — до 30%, способен работать в режиме реального времени, пакет содержит DirectShow-кодеки (компрессор, декомпрессор, сплиттер), позволяющие приложениям работать с потоками True Audio. С корректно установленными DirectShow-кодеками пользователь может проигрывать файлы формата TTA в совместимых плейерах (RealOne, RadLight, Windows Media).
WavPack — бесплатно распространяемый формат и кодек, разработанный под Windows; снабжен плагинами, обеспечивающими возможность установки на наиболее распространенные плейеры. Особенностью является наличие возможности создания двух файлов: один — с потерей качества, другой — корректирующий (обеспечивает восстановление качества основного файла).
WMA (Windows Media Audio) — стандартный формат звукозаписи со сжатием для Windows XP MCE. Качество записи приемлемо для большинства слушателей, однако не безупречное (наблюдается плохая передача частотных составляющих сигнала выше 14-15 кГц). Значения коэффициентов сжатия WMA для разных образцов тестового сигнала при битрейте 128 бит/с составляют от 5 до 10, 4.
Статья находится в рубриках
Яндекс.Метрика