Звуковые файлы

Звуковые файлы (sound files, audio files) — файлы, содержащие цифровую запись аудиоданных (голоса, музыкальных произведений или их фрагментов и других звуков любой природы); существуют два основных типа звуковых файлов: с оцифрованным звуком и нотной записью. Звуковые файлы представляют собой составную часть мультимедиа.
Файлы с оцифрованным звуком (digitized sound files) — звуковые файлы, в которых исходная непрерывная («аналоговая») форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных («выбранных») через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling), а такую форму записи — импульсно-кодовой (pulse code). Аппаратная реализация обработки оцифрованного звука состоит в том, что аналого-цифрового преобразователь (АЦП) преобразует аналоговый сигнал в множество цифровых замеров, а при воспроизведении цифро-аналоговый преобразователь (ЦАП) осуществляет обратный процесс — преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.
Файлы с нотной записью (song file, music file) — звуковые файлы, которые содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени. Формат может предусматривать одновременную игру нескольких музыкальных инструментов, в этом случае говорят о соответствующем количестве голосов.
Редактировать

Основные стандарты многоканального звука

Dolby Stereo — стандарт на технологию цифровой записи/воспроизведения звукового сопровождения фильмов для кинотеатров, позволяет кодировать на двух звуковых дорожках кинопленки четыре канала: левый, центральный, правый и тыловой. Считанный с кинопленки сигнал преобразуется декодером в четырехканальный, дающий эффект окружающего (surround) звука. Без декодера звук воспроизводится как обычный двухканальный стерео. Стандарт предложен компанией Dolby Laboratories в 1976 году.
DDS (Dolby Surround Sound) — стандарт на технологию цифровой записи/воспроизведения звукового сопровождения фильмов в частотном диапазоне 100-7000 Гц для домашних кинотеатров. Стандарт позволяет кодировать на двух звуковых дорожках кинопленки три канала: левый, правый и тыловой. Считанный с кинопленки сигнал декодируется в трехканальный. Без декодера звук воспроизводится как обычный двухканальный стерео. Стандарт предложен компанией Dolby Laboratories в 1982 году.
DPL (Dolby Surround Pro Logic) — развитие стандарта DDS для домашних кинотеатров с трех на четыре канала звука: левый, центральный, правый и тыловой. Стандарт предложен компанией Dolby Laboratories в 1987 году.
Dolby Digital — стандарт кодирования/декодирования записи шестиканального звука (5+1) в диапазоне от 20 Гц до 20 кГц: 5 каналов окружающего звука и одним низкочастотным (сабвуферным). Стандарт предложен компанией Dolby Laboratories в 1992 году. Частотный диапазон пяти каналов составляет от 3 Гц до 20 кГц, сабвуфера — от 3 Гц до 120 кГц.
Dolby Digital AC3 — дополнение стандарта Dolby Digital схемой, обеспечивающей плотность сжатия записи звука от 12:1 и более при значении битрейта от 64 до 640 Кбит/с при высоком качестве воспроизведения.
Dolby Surround AC3 — упрощенный вариант стандарта Dolby Digital для домашних кинотеатров, отличающийся сниженными скоростями потоков данных.
DTS (Digital Theater System) — стандарт шестиканальной (5+1) записи звука на музыкальных DVD, близок к Dolby Digital, отличается меньшим коэффициентом сжатия (4:1), повышенной скоростью потока данных (битрейт — 882 Кбит/с). За счет этого, а также использования совершенного алгоритма сжатия характеризуется высоким качеством записи и воспроизведения звука. При записи используется частота дискретизации 48 кГц, что делает стандарт наиболее высококачественным из всех стандартов записи звука на DVD.
Dolby Pro Logic II — развитие стандарта Dolby Surround Pro Logic, обеспечивающее разложение обычного стереозвука на шесть каналов: 5+1.
Dolby Pro Logic Iix — развитие стандарта Dolby Surround Pro Logic, обеспечивающий разложение стереозвука на 7 (6+1) или 8 каналов (7+1). Возможны режимы декодирования: фильм (Movie) — производится дублирование центрального канала или тыловых каналов; игра (Play) — сигнал дополнительно направляется на «новые каналы»; музыка (Music).
Dolby Digital EX — вариант стандарта Dolby Pro Logic Iix для домашних кинотеатров.
Dolby Digital Surround EX — расширенный до 7 каналов (6+1) вариант стандарта Dolby Digital Surround, в котором имеется дополнительный тыловой (задний) канал, дублирующий центральный канал, если звук записан в формате 5+1. Если звук записан в формате 6+1, то дополнительный канал становится полноценным каналом окружающего звука.
DTS-ES — аналог стандарта Dolby Digital EX, разработанный компанией DTS; позволяет кодировать звук в форматах 6+1 и 7+1 и раскладывать звук, закодированный в формате DTS (5+1) на 7 (6+1) или 8 (7+1) каналов.
Редактировать

Другие форматы и аудиокодеки

AAC (Advanced Audio Coding) — цифровой формат кодирования, обеспечивающий высокое качество записи и воспроизведения музыкальных произведений. Полагают, что AAC превосходит по качеству звучания формат аудиозаписи MP3. AAC используется в стационарных, мобильных и переносных записывающих и воспроизводящих устройствах фирмы Apple (например, плейерах серии iPod).
FLAC — формат сжатия аудиофайлов без потери качества. Его особенности: многоплатформенность (возможность использования практически со всеми действующими ОС), постоянное обновление, наличие удобной графической оболочки, внешних модулей (плагинов) для разных проигрывателей, утилиты командной строки, выполняющей сжатие и распаковку файлов, а также утилиты для редактирования метаданных в файлах.
Monkey`s Audio — бесплатно распространяемый формат сжатия аудиофайлов. Его характеристики: отсутствие потерь качества, коэффициент сжатия — 40-50%, работает на платформе Windows, имеется плагин для проигрывателей Winamp, позволяет кодировать WAV-файлы с любой частотой дискретизации с 8-, 16-, или 24-битным динамическим диапазоном в моно- или стереорежиме. Аудиофайлы имеют расширение *.ape. Формат имеет открытый исходный код, что позволяет разработчикам включать поддержку этого кодека в свои программы.
OGG (Ogg Vorbis) — звуковой формат, часть проекта полностью открытой мультимедийной системы. По всем основным показателям (качество воспроизведения звукового спектра, наличие внесенных шумов, коэффициент сжатия) OGG опережает WMA на 2-30% в зависимости от типа музыки. Значения коэффициентов сжатия OGG для разных образцов тестового сигнала при битрейте 128 бит/с составляют от 6 до 12. OGG-файл записи популярной музыки при битрейте 128 кбит/с может быть в 1, 5 раза короче MP3-файла, несмотря на использование совместно с MP3 адаптивного сжатия VBR1 (Lame v.1.12, engine 3.86).
RA (Real Audio) — формат потоковой записи (последовательной и непрерывной) и/или передачи аудиоданных; распространенная система передачи звука в реальном масштабе времени через Интернет (телефонная связь, радиотрансляция). Real Audio содержит метод сжатия и одновременно протокол передачи оцифрованного звука.
SPDI/F (Sony/Philips Digital Interface Format) — формат обмена аудиоданными в цифровом виде без промежуточного преобразования в аналоговый сигнал, совместная разработка фирм Sony и Philips; обеспечивает высокое качество передачи звука.
TTA — бесплатный мультиплатформенный аудиокодек для сжатия без потерь 8-, 16- или 24-битных WAV-файлов; создан российскими разработчиками. Его характеристики: коэффициент сжатия — до 30%, способен работать в режиме реального времени, пакет содержит DirectShow-кодеки (компрессор, декомпрессор, сплиттер), позволяющие приложениям работать с потоками True Audio. С корректно установленными DirectShow-кодеками пользователь может проигрывать файлы формата TTA в совместимых плейерах (RealOne, RadLight, Windows Media).
WavPack — бесплатно распространяемый формат и кодек, разработанный под Windows; снабжен плагинами, обеспечивающими возможность установки на наиболее распространенные плейеры. Особенностью является наличие возможности создания двух файлов: один — с потерей качества, другой — корректирующий (обеспечивает восстановление качества основного файла).
WMA (Windows Media Audio) — стандартный формат звукозаписи со сжатием для Windows XP MCE. Качество записи приемлемо для большинства слушателей, однако не безупречное (наблюдается плохая передача частотных составляющих сигнала выше 14-15 кГц). Значения коэффициентов сжатия WMA для разных образцов тестового сигнала при битрейте 128 бит/с составляют от 5 до 10, 4.
MP3, mp3 (сокр.от MPEG-1 Audio Layer III или MPEG-2 Audio Layer III) — один из самых распространённых и популярных аудиоформатов цифрового кодирования звуковой информации. Разработан командой MPEG. Формат был лицензируемым, но 23 апреля 2017 года срок действия всех патентов истёк и лицензионные сборы прекращены. Этот формат широко используется в файлообменных сетях для оценочного скачивания музыкальных произведений. Проигрывается практически во всех популярных операционных системах, на большинстве портативных аудиоплееров, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
Редактировать

Цифровые аудиоформаты по степени сжатия

Кодирование без потерь
Кодирование с потерями
Без сжатия
Со сжатием звука без потерь
  • AIFF
  • AU
  • CDDA — формат, используемый в аудио-CD
  • DSD — формат, используемый в SACD
  • DXD — качество цифровой звукозаписи DXD по многим параметрам превосходит не только другие ИКМ-форматы, но и DSD.
  • IFF-8SVX — Interchange File Format
  • IFF-16SV
  • RAW — необработанные («сырые») замеры без какого-либо заголовка или синхронизации
  • WAV — Microsoft Wave (Waveform audio format); разработан совместно с IBM
  • FLAC (.flac) — свободный кодек из проекта Ogg
  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression (LPAC; .pac)
  • Apple Lossless (.m4a)
  • Monkey's Audio (.ape)
  • OptimFROG (.ofr)[1]
  • RKAU (.rka)[2]
  • Shorten (.shn)
  • TTA — True Audio, свободный кодек
  • TAK (.tak) — Tom’s lossless Audio Kompressor
  • WavPack (.wv)
  • Windows Media Audio 9 Lossless (.wma)
  • ADX — формат звука с максимальным битрейтом 1 Гбит/с
  • PXD (.pxd) — формат компании PXD Media. Один из первых аудиокодеков без потерь (1997). Используется в музыкальных конструкторах EJAY и других.
  • MP2 — MPEG-1/2 Layer 2 (Musicam)
  • MP3 — MPEG-1/2/2.5 Layer 3
  • Vorbis — проект Ogg, свободный, похож по принципам на MP3
  • Speex — проект Ogg, свободный, сжатие голоса, низкий битрейт
  • Opus — проект Ogg, свободный, передача звука по сети; основан на технологиях кодеков CELT и SILK.
  • GSM-FR — GSM Full Rate, изначально для сотовых телефонов
  • G.723.1 — один из базовых кодеков речевой IP-телефонии
  • G.729 — эффективный узкополосный речевой кодек IP-телефонии
  • Windows Media Audio (WMA)
  • AAC (.m4a, .mp4, .m4p, .aac) — Advanced Audio Coding, часто в контейнере MPEG-4
  • Musepack — Musepack (MPC)
  • TwinVQ — Yamaha TwinVQ (VQF)
  • RealAudio (RA, RM)
  • OTS Audio File — похож на MP3
  • SWA — Macromedia Shockwave Audio; сжатие как в MP3 с дополнительными заголовками для Macromedia Director
Статья находится в рубриках
Яндекс.Метрика