Какие звуковые форматы. Обзор наиболее распространенных аудиокодеков

Сжат с использованием специальных lossless звуковых кодеков, его можно при желании восстановить с абсолютной точностью.

Если вы возьмете обыкновенный Audio CD диск с аналоговым звуком запишете его в формате WAV для звука без компрессии, затем выполните компрессию WAV с использованием кодека lossless, далее полученный звуковой файл декомпрессируете в WAV и результат запишете на чистый CD, то можете получить два совершенно идентичных Audio CD.

Преимущество lossless для хранения звуковой коллекции состоит в том, что качество записей намного выше, чем у lossy кодеков, а места они занимают меньше, чем несжатое аудио. Правда, файлы lossy меньше по размеру, чем музыкальные файлы без потери качества. Большая часть современных программ-плееров понимают формат lossless. Те программы, которые не в состоянии его воспроизводить, могут легко этому научиться, используя плагин lossless. Что такое звуковые форматы lossless?

Звуковые форматы без потери качества

Подлинного любителя музыки вряд ли устроит звучание музыки, записанной в форматах со сжатием Ogg Vorbis или MP3. Конечно, если аудиозаписи прослушивать на бытовой аудиоаппаратуре, недостатки звучания невозможно уловить на слух, но если попытаться проиграть сжатый файл на высококачественной аппаратуре класса Hi-Fi, сразу обнаружатся недочеты звука. Безусловно, создать коллекцию качественной музыки на CD или виниловых пластинках нелегко. Есть разумная альтернатива этому пути для любителей качественного звука - lossless музыка. Ее можно хранить на ПК в виде, дающем возможность сохранить неизменными исходные параметры музыки, даже если применено сжатие. Этот путь одновременно решает проблемы высокого качества музыки и компактного ее хранения, ведь аудиоаппаратура для прослушивания (наушники, колонки, усилители) имеет вполне доступную цену.

Несжатые форматы звука без потери качества:

  • CDDA — является стандартом аудио CD;
  • WAV — Microsoft Wave;
  • IFF-8SVX;
  • IFF-16SV;
  • AIFF;

Сжатые форматы:

  • FLAC;
  • APE - Monkey’s Audio;
  • M4A - Apple Lossless - формат качественной музыки от Apple;
  • WV - WavPack;
  • WMA - Windows Media Audio 9;
  • TTA - True Audio.
  • LPAC;
  • OFR - OptimFROG;
  • RKA - RKAU;
  • SHN - Shorten.

Формат FLAC

Самым распространенным форматом является формат От аудиокодеков с потерями его отличает то, что из звукового потока при его использовании не удаляется никаких данных. Это дает возможность с успехом использовать его для воспроизведения музыки на Hi-Fi- и Hi-End-оборудовании, а также для создания архива коллекции аудиозаписей.

Большим достоинством формата является его свободное распространение. Это немаловажно для музыкантов, самостоятельно записывающих музыку. Формат в последнее время приобрел большую популярность, благодаря чему его поддержка включена в подавляющее большинство медиапроигрывателей.

Формат APE

В отличие от FLAC, для формата APE имеются только лишь кодеки и плагины, рассчитанные на платформу Windows. Для других платформ имеются дорогие решения от сторонних производителей ПО. Алгоритм способен достичь сжатия звуковой информации без потерь примерно в 1,5-2 раза. В него входит три главных этапа кодирования, из которых лишь один основан на применении свойств, присущих звуку для сжатия. Остальные схожи с обычными архиваторами. Несмотря на то что алгоритм сжатия распространяется бесплатно, ограничения лицензии таковы, что для музыкантов-любителей он практически недоступен.

Формат Apple Lossless

Музыка высокого качества lossless может прослушиваться с использованием кодека сжатия звука без ущерба качеству от компании Apple. Этот формат разработан компанией Apple для использования в собственных устройствах. Формат совместим плеерами iPod, имеющими специальные док-разъемы и новейшие прошивки. В формате не применен специфический инструментарий управления правами (DRM), но формат контейнера содержит такие возможности. Также он поддерживается приложением QuickTime и входит в качестве функции в программу iTunes.

Формат входит в состав библиотек, находящихся в свободном доступе, что дает возможность организовать прослушивание файлов в приложениях Windows. В 2011 году компания Apple обнародовала исходные коды формата, что открывает широкие перспективы перед кодеком. В будущем он может составить серьезную конкуренцию прочим форматам. Тесты продемонстрировали неплохие результаты. Сжатые файлы имеют размер от 40-60% от размера оригиналов. Впечатляет также скорость декодирования, что оправдывает его применение для мобильных устройств, производительность которых невелика.

Одним из недостатков кодека является совпадение расширения звуковых файлов с аудиокодеком Это приводит к путанице, ведь AAC не является форматом музыки высокого качества. Поэтому решено было данные хранить в MP4 контейнере с расширением.m4a.

Из других форматов стоит упомянуть Windows Media Audio 9 Lossless, входящий в состав приложения Windows Media. Он работает с Windows и Mac OS X. Правда, пользователи отзываются о нем не очень одобрительно. Часто возникают проблемы с совместимостью кодека, да и количество поддерживаемых каналов ограничено шестью.

Формат WavPack

WavPack - еще один свободно распространяемый аудиокодек, сжимающий звуковую информацию без потерь качества. В WavPack интегрирован эксклюзивный комбинированный режим, позволяющий создавать два файла. Один из файлов в таком режиме создается сравнительно небольшого потерями качества.wv, который можно проигрывать самостоятельно. Второй файл «.wvc» корректирует предыдущий «.wv» и в комбинации с ним дает возможность в восстановить оригинал в полной мере. Некоторым пользователям такой подход может показаться перспективным, ведь не нужно выбирать между двумя видами сжатия - всегда будут реализованы оба.

Заслуживает также внимания видеокодек с высококачественным звуком - lagarith lossless codec. Он работает быстро и качественно.

Софт для прослушивания lossless-аудио

Программные плееры не сразу научились работать со специфическими lossless кодеками, которые могут без потерь воспроизвести звук.

Плеер WinAmp

Способен справиться практически со всеми форматами воспроизведения музыки без потерь качества lossless. Что такое хороший плеер lossless, можно понять на его примере. Он способен корректно справляться с обработкой отдельных треков в формате lossless. Это типичная проблема кодеков FLAC или APE. Она состоит в том, что оцифровывается сразу весь звуковой диск и записывается одним файлом без разделения на треки. Проблему разделения на треки призван решить добавочный файл, имеющий расширение.cue. Он содержит описание параметров доступа к каждому треку альбома. Обыкновенный плеер воспроизводит весь lossless файл целиком. Проигрыватель для lossless AIMP замечательно воспроизводит большую часть звуковых форматов и распознает треки в файле lossless формата.

Цифровые плееры с поддержкой lossless

Хорошо отзываются пользователи о цифровых плеерах jetAudio, Foobar2000, Spider Player. Кардинальных отличий между ними нет. Выбор любого устройства основывается на субъективном мнении меломана об удобстве интерфейса для воспроизведения lossless. Что такое lossless формат, можно узнать протестировав эти плееры.

Формат Apple Lossless проигрывается с использованием iTunes. Кроме того, данный кодек поддерживается популярным видеоплеером VLC.

Хозяева компьютеров, совместимых с Apple, могут использовать две интересные программы: Vox и Cog.

Они поддерживают такие lossless форматы:

  • Apple Lossless;
  • FLAC;
  • Monkeys Audio;
  • Wavpack.

Дополнительно к этому имеется много полезных возможностей, например поддерживаются сервисы Last.fm.

Владельцы компьютеров с системой Windows могут использовать любое приложение, которое совместимо с кодеками музыки без потери качества: Foobar2000 или WinAmp. Для Winamp требуются специальные плагины. Lossless музыка хорошо воспроизводится на iTunes и KMPlayer. Достоинство iTunes, которого нет в других плеерах - возможность поддержки тегов.

Устройства, совместимые с lossless

Вряд ли хозяин фонотеки захочет расходовать время на то, чтобы преобразовать файлы из формата FLAC в MP3, чтобы иметь возможность прослушивания записей на своем гаджете. У смартфона или планшета ограниченные возможности, несравнимые с компьютером, но тем не менее многие из мобильных устройств проигрывают lossless-форматы.

Например, владельцы устройств под управлением Android могут воспользоваться плеером andLess. Он способен проигрывать файлы в форматах FLAC, APE, несжатый WAV и другие форматы, поддерживаемые Android.

Хуже обстоят дела у владельцев устройств на платформе Blackberry. Лишь обладатели моделей Bold 9000 и 8900 и более поздних версий могут прослушивать lossless формат.

Обладатели устройств Apple без проблем могут использовать кодек ALAC. Он поддерживается плеером iPod (кроме shuffle), телефоном iPhone и планшетом iPad. Для формата FLAC можно скачать FLAC Player в App Store.

Кодек FLAC поддерживается устройствами Samsung Galaxy, некоторыми смартфонами Sony Ericsson и плеерами iriver.

Получили поддержку FLAC и стационарные устройства многих производителей. Медиаплееры и медиацентры позволяют обойтись без персонального компьютера при прослушивании композиций без потери качества.

Пока еще до полной поддержки абсолютно всех форматов далеко, но вполне хватает того, что медиаплеер понимает кодек FLAC - самый распространенный кодек качественной музыки lossless. Что такое аппаратура воспроизведения lossless?

Аппаратура для прослушивания

Чтобы получить настоящее удовольствие от качества звука, необходима специальная аппаратура: наушники, усилители, колонки. Проще всего, конечно, с наушниками. Если вы намерены наслаждаться музыкой сидя за компьютером, они подойдут лучше всего. Хорошо отзываются пользователи о продукции компаний Koss и Sennheiser. Особенное внимание нужно обратить на размер мембраны. Чем он больше, тем лучше звучание. Важно не обмануться. Некоторые производители ставят маленькую мембрану в большие амбушюры - выглядят такие наушники солидно, а звук пригоден лишь для прослушивания mp3.

Почитателям аппаратуры качественного звука (Hi-Fi или Hi-End) трудно что-либо рекомендовать. Выбор в этой области ограничивается лишь бюджетом и вкусами. Эквалайзер, усилитель, акустика - выбор этих устройств имеет множество вариантов. Владельцам ПК, выбирающим себе качественную лучше остановиться на бюджетных мониторных колонках любого известного бренда. Хорошо отзываются пользователи об акустике Microlab серии SOLO. Чтобы музыка в lossless качестве звучала хорошо, важно приобрести акустику с наличием сабвуфера. не под силу справиться с воспроизведением нижней полосы частот.

Итоги

Новые форматы цифрового звука дали возможность любителям качественной музыки обзавестись собственными библиотеками на носителях информации большой емкости и слушать любимые композиции в высоком качестве, сэкономив достаточно большие деньги и довольно много места. Идеальным вариантом, безусловно, является полный комплект Hi-End оборудования, но и бюджетные варианты доставят меломанам огромное удовольствие. Ведь ощущения от прослушивания музыки несравнимы с MP3 на пластиковых колонках.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.



IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Наверняка вы хоть раз в жизни сталкивались с тем, что ваш компьютер отказывался воспроизводить скачанную музыку, видеоролик или фильм с диска именно в тот день, когда вы решили провести приятный вечер у экрана монитора. От этой проблемы можно избавиться раз и навсегда, если переустановить или обновить кодеки.

Не знаете, что такое кодеки и как они работают? Тогда эта статья – для вас! Из нее вы узнаете, для чего нужны кодеки и какими они бывают, а также поймете, как устроен процесс воспроизведения видео на ПК и мобильных устройствах.

Всё, что нужно знать о кодеках


Кодеком (от английского codec ) называют программу, предназначенную для кодирования и декодирования данных мультимедиа (например, аудио- и видеопотоков). Каждый кодек «специализируется» только на одном типе данных. За обработку звуковых записей отвечают аудиокодеки (AAC, AIF, AU, MP3, RA, RAM, WMA, FLAC), с видео работают видеокодеки (DivX, AVI, H.261, H.263, H.264, MPEG, RM, RV, WMV). Над роликами, в которых содержится и звук, и видео, «колдуют» оба этих типа кодеков.

Также существуют кодеки, предназначенные для обработки цифровых изображений и текста, однако в этой статье речь пойдет именно об аудио- и видеокодеках.

Как работают кодеки?

Представьте, что вы записали ролик на видеокамеру, загрузили его в компьютер и открыли с помощью проигрывателя. Казалось бы, пустяковое дело! Но кодекам на вашей камере и компьютере пришлось немало потрудиться, чтобы вы смогли это сделать. Давайте посмотрим, чем же занимаются эти программы, когда вы записываете видео и проигрываете снятые клипы.


Кодеки принимаются за работу в тот самый момент, когда вы нажимаете кнопку записи на своей камере. Прямо во время съемки видеокодек сжимает и кодирует видеодорожку, а аудиокодек работает со звуковой дорожкой. Затем оба потока синхронизируются и сохраняются в одном медиаконтейнере, а если говорить проще – формате. Камеры могут вести запись как в популярных форматах типа AVI и MP4, так и в более экзотических.

Теперь, когда вы перенесли снятый клип на свой компьютер, в дело вступают кодеки, установленные на нем: видеокодек распаковывает изображение, аудиокодек – звуковую дорожку, а проигрыватель выводит эту информацию на экран и в колонки вашего компьютера.

Зачем все эти сложности?

Неужели нельзя обойтись без кодирования? Теоретически – можно, на практике – лучше не стоит. Дело в том, что кодеки выполняют очень важную функцию: они сжимают файлы до размеров, приемлемых для современных устройств.

Видеофайлы, создаваемые камерами в процессе записи, имеют слишком большой размер: пятиминутный ролик, снятый на современный смартфон, в несжатом состоянии может занимать несколько гигабайт памяти! Вспомните, сколько места есть на дисках вашего компьютера и мобильных устройств, и представьте, сколько несжатых видеороликов вы могли бы на нем хранить – вряд ли эта цифра будет слишком большой.

Возможно, в будущем, когда память компьютеров и гаджетов будет исчисляться десятками и сотнями терабайтов, необходимость в использовании кодеков отпадет, но сейчас без этих шустрых программ, превращающих гигабайтные видео в мегабайтные, нам не обойтись.

Как же кодеки уменьшают размер файлов?

Сжатие видео и аудио происходит за счет устранения так называемой избыточности данных. Как это происходит? Представьте, что вы в течение 5 минут снимали морской пейзаж – такой, как на картинке:


Допустим, ваша камера снимает со скоростью 30 кадров в секунду. Получается, за 1 секунду записи она сохраняет в своей памяти 30 уникальных изображений. А за 5 минут (300 секунд) она снимет целых 9000 кадров!

Но что может кардинально измениться в этом пейзаже за 1 секунду? Позеленеет небо? Испарится вода?

Даже если произойдут какие-то изменения, то они будут плавными, и на их осуществление потребуется время. Вывод: ежесекундно камера снимает 30 практически полностью идентичных друг другу кадров.

Так зачем же сохранять в памяти все эти кадры целиком? Для записи пейзажа на видео кодеку достаточно сохранить один исходный кадр, найти все похожие на него и удалить из похожих кадров повторяющиеся части изображения. Затем, при воспроизведении видео, кодек будет наслаивать изменяющиеся части на исходное изображение. Если в картинке что-то поменяется, кодек выделит еще один исходный кадр и все на него похожие. Описанный алгоритм называют компенсацией движения и считают одним из основных методов сжатия видеоданных.

Компенсация движения – это всего лишь один из множества методов, применяемых видеокодеками при обработке записей с камер. Свои способы устранения избыточной информации используют и аудиокодеки. В результате работы кодеков из аудио- и видеопотоков удаляется большая часть «лишних» данных. За счет этого и происходит изменение объема закодированного файла.

Какой кодек выбрать?

Существует множество видео- и аудиокодеков, предназначенных для различных целей. Вот краткий список самых популярных кодеков:

  • H.264 (MPEG-4)
  • MPEG-2
  • H.265 (MPEG-H, HEVC)
  • Flash

Чтобы вам не пришлось подолгу искать, какой кодек лучше подойдет вам, мы советуем скачать K-Lite Codec Pack – универсальный пакет для Windows, в котором есть все, что понадобится для проигрывания практически любого видео: самые хорошие кодеки для AVI, MKV, MP4 и других форматов.

А вдруг кодек сработает неправильно и удалит нужную информацию?
Можно ли обработать видеофайл без потерь?

В основе современных кодеков лежат сложные комплексные алгоритмы сжатия данных, которые помогают свести потери информации к минимуму. Однако если вы все-таки хотите перестраховаться, у нас есть хорошие новости: существуют так называемые lossless-кодеки, обрабатывающие видео без потерь. Это значит, что при декодировании потока информация будет воспроизведена бит к биту. Однако следует быть готовыми к тому, что размер видеофайла, обработанного такими кодеками, будет довольно большим.

Термином «аудио» сегодня обозначают все, что так или иначе связано со звуком. Это и обработка, и воспроизведение, и сведение и просто прослушивание аудиозаписей. Мало кому известно, что за время своего существования все популярные аудио-форматы претерпевали существенные изменения, порой в лучшую сторону, а порой даже в худшую.


Проблема заключается в том, что, когда создатели пытались повысить качество записи при использовании нового формата, это значительно увеличивало размер полученного результата. А уменьшение размера конечного файла приводило в результате к существенной потере качества. Но так дела обстояли не всегда.

Первый аудио-формат, который использовался в компьютерных играх

Первое упоминание о компьютерном звуке связано с созданием различных примитивных видео-игр. Тогда звук воспроизводился при помощи системного динамика. Как не пытались разработчики программного обеспечения тех времен, добиться того уровня качества, которое было бы совместимо с кассетными и бобинными магнитофонами не получилось. Именно это заставило многих разработчиков задуматься над вопросом, как изменить формат аудио, чтобы звук был более естественным и натуральным. Именно эта проблема и привела к сегодняшней конкуренции на рынке аудио-устройств. В результате используемые форматы сильно сказываются на качестве воспроизводимого материала и настройках основных параметров воспроизведения.

Формат WAV

Первое полноценное качество аудио-форматов связано именно с этим форматом. Обозначение расширения WAV было образовано от английского слова «wave», что в переводе на русский значит волна. Именно этот формат и стал первым аудио-форматом, обрабатываемым при помощи компьютерных программ на высокопрофессиональном уровне. У файлов с расширением WAV имелись следующие характеристики:

— глубина звука;
— частота дискретизации;
— битрейт и т.д.

Данный формат был совместим даже с тем звуком, который можно было получить после обработки аудио-CD с помощью эквалайзера и других инструментов. Однако, размер файла в этом случае был совершенно не оправдан. Например, самый обычный трек продолжительностью в 3 минуты мог занимать до 50 Мегабайт.

CD-диски

Аудио-CD или, если говорить точнее, расширение.cda, появились примерно в то же время, что и формат wav. Но в отличие от файлов с расширением wav, .cda не поддается редактированию. Но его можно открыть в любой программе по обработке аудио, перекодировать и изменить формат и сохранить на жестком диске. Сохранить изменения на CD, само собой, не получится.

MP3 кодек

После появления в музыкальной индустрии кодека LAME MP3 Encoder случилась настоящая революция в мире аудио. Теперь аудио-файлы стали «весить» в десятки раз меньше. При максимальном сжатии размер пятиминутной композиции редко превышает 7 Мб. Это было существенным прорывом. Кроме того, в данном расширении наконец-то была реализована возможность откорректировать некоторые характеристики и настроить дополнительные параметры, такие, как ID3-теги. В них может содержаться информация о названии трека, исполнителе, альбома и дате его выпуска.

Разумеется, данный формат сразу же получил большое распространение. Практически все интернет-сообщество использует данный универсальный формат. Так что можно сказать, что формат MP3 совершил настоящий переворот в сфере компьютерного звука. На сегодняшний день это один и наиболее востребованных и популярных аудио-форматов. Хотя сегодня ему на смену уже приходят другие аудио-форматы. Но это мы обсудим немного позже.

AIFF-файлы

Существует еще одна разновидность аудио-файлов. Это так называемый формат aiff. Изначально данный формат создавался для использования на компьютерах Macintosh. Немного позже случилась трансформация, в результате которой удалось добиться совместимости различных форматов аудио и возможности их использования на различных платформах и операционных системах.

OGG-формат

Данный аудио-формат также встречается довольно часто. Он был разработан специалистами компании Vorbis. Отметим, что данный формат имеет ряд недостатков. Прежде всего, несмотря на небольшой размер файлов использование данного формата приводит к высокой нагрузке на системные ресурсы компьютера.

Также для работы с данным аудио-форматом необходимо использовать собственные декодеры и кодеки, которые могут не устанавливаться в автоматическом режиме. Так, например, тем, кто работал с программой FL Studio Producer Edition для работы с данным форматом нужно было вручную активировать установочный файл в формате.inf. Иначе файлы формата OGG данным приложением просто не воспроизводились. Несмотря на все эти недостатки, аудио-файлы формата OGG сегодня встречаются довольно часто, да и звучание у них неплохое.

Обсудим еще один формат аудио-файлов – AMR. Его смело можно отнести к низкопробным аудио-форматам. Данный формат возник в эпоху примитивных мобильных телефонов, которые не могли устанавливать в качестве мелодии звонка файлы в формате.mp3. AMR был разработан с целью замены натурального звучания, однако при этом использование данного формата приводило к существенной потере качества. Качество аудио-файлов, сохраненных в данном формате, нельзя даже сравнить с современными «продвинутыми» аудио-форматами.

Формат MIDI

Возможно кому-то это покажется странным, но формат MIDI также относится к аудио-форматам. Сегодня принято считать, что MIDI-система представляет собой простой набор команд. Однако это довольно спорное утверждение. Аббревиатура MIDI расшифровывается как Musical Instrument Digital Interface.

Эта система предназначена для редактирования и записи аудио-файлов путем нажатия клавиш, изменения темпа, тональности, высоты и добавлением различных эффектов. Файлы с расширениями.midi или.mid легко воспроизводятся на современных программах аудио-записи и секвенсорах. При этом используется стандартный набор звуков в формате GS, GM или XG. Первые два формата разработаны компанией Roland, последний – корпорацией Yamaha. В формате GS и GM присутствует набор 128 стандартных звуков, в формате XG их почти в три раза больше.

Вот мы и подошли к одному из самых уникальных аудио-форматов на сегодняшний день. Музыкальные композиции в формате FLAC сегодня получили широкое распространение. В первую очередь, это связано с качеством звучания, а ведь именно на это обращают внимание настоящие меломаны. Если разобраться в истории создании данного формата, то можно обнаружить, что создан он был на основе MP3. Ранее было использовано разделение аудиокомпозиций на отдельные треки. В формате FLAC такого нет.

В структуре аудио-файла в формате FLAC имеется один или два файлов. Один из них информационный. Для воспроизведения данного формата нужно использовать специальные аудиоплееры. Одним из таких плееров является программа AIMP. При запуске основного файла, в окошке плеера появляется целый список музыкальных дорожек, которые содержатся в контейнере. Переключение между композициями в данном плеере осуществляется по тому же принципу, что и в любом другом проигрывателе. Преимуществом данного формата является исключение возможности случайного удаления треков (как уже было сказано ранее, все дорожки содержатся в одном файле).

Совместимость различных аудио-форматов

Сегодня многие аудио-форматы совместимы друг с другом. Современные DVD-плееры и программные проигрыватели без труда справится с воспроизведением любого из них. Это же относится и профессиональным редакторам звука. Программы для обработки сегодня распознают практически все известные на настоящий момент аудио-форматы, даже несмотря на некоторые специфические характеристики операционных систем. Секвенсоры, аудио-редакторы и дополнительные модули способны работать с различными форматами аудио в кроссплатформенном режиме.

Преобразование аудио-форматов

Существует несколько способов изменения аудио-файлов. Например, можно открыть файл в его «родном» формате, а сохранить в другом. Можно сделать еще проще. Для преобразования аудио-форматов используются специальные программы – конверторы. Чтобы преобразовать аудио-файл, его достаточно загрузить в данную программу в начальном формате, потом выбрать конечный и конвертировать. Вот так, легко и просто!

Обработка звука

Иначе дело обстоит со специальными программами для обработки. При необходимости изменить частотные характеристики исходных файлов без профессиональных программных пакетов не обойтись. С помощью таких приложений можно изменять качество аудио-файлов. Причем менять можно не только стандартную частоту дискретизации. Такие программные приложения позволяют изменять настройку глубины с 16 до 24 или даже 32 бит.

Также можно настроить пропускную воспроизводимую способность, или проще говоря битрейт. Стандартно используется значение битрейта в 128 кбит/c, однако лучшего качества звука удается достичь на отметке в 320 Кбит/сек. Не все способны уловить разницу между звуков со стандартными параметрами и звуком, характеристики в котором выставлены по максимуму.

Но лучше все-таки одни раз попробовать воспроизвести один и тот же трек с разными характеристиками на хорошей аудио-аппаратуре. Вы сразу же заметите разницу. Программы для обработки аудио позволяют не только редактировать вышеперечисленные параметры. В мощных программных пакетах для обработки звука, как правило, присутствует множество модулей. Это могут быть и лимитеры, и программные эквалайзеры, и кроссоверы, и компрессоры, и нормалайзеры и много всего другого. Использование каждого модуля позволяет настроить звучание композиции на свой вкус. При помощи таких программ можно обрабатывать аудиофайлы любого формата.

Сравнение

В заключение попробуем провести краткий анализ всех рассмотренных в данной статье аудио-форматов. Формат WAV несмотря на свою «тяжеловесность» может использоваться в качестве промежуточного формата для последующего конвертирования. Чаще всего файлы этого типа встречаются при записи живого звука или сохранении открытых проектов. Формат.cda на сегодняшний день утратил свою актуальность. Форматы OGG и AIFF лучше всего использовать в виртуальной студии. Формат AMR на сегодняшний день можно считать устаревшим.

Аудиофайлы в формате MIDI используются в основном музыкантами. Лучшим на сегодняшний день аудио-форматом является FLAC. По мнению многих специалистов именно он является самым продвинутым. Однако и уже привычный всем MP3 рано списывать со счетов. Индустрия видео и звука не стоит на месте, наверняка в скором времени нас ждет еще огромное число новых аудио-форматов.

Является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format.

WavPack (расширение.WV)

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл «коррекции» (.wvc), который (в комбинации с предыдущим.wv) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

Формат имеет очень хорошую поддержку в проигрывателях. Помимо, разумеется, плагина для Winamp с официального сайта кодека http://www.wavpack.com можно закачать плагины для Adobe Audition (!) и Nero Burning Rom. Есть отличный плагин для XMMS – аналога Winamp для Linux. Кроме того существует проект по разработке DirectShow фильтров для WavPack – это позволит использовать формат в любой Windows-программе, в том числе и Windows Media Player. Скачать последнюю версию можно отсюда. Для WavPack существует фронтэнд от сторонних разработчиков. Его качаем тут.

С технической точки зрения также придраться не к чему. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота семплирования – до 192 кГц (!).

Формат, как и исходные коды программы для сжатия являются открытыми. К большому сожалению кодер скомпилирован лишь для платформы Windows, однако всегда остаётся возможность самостоятельно перекомпилировать доступные исходные коды для своей операционной системы.

Сайт, как и сам кодек регулярно обновляются, что не может не радовать.

DTS - Digital Theater System, по сути - это Dolby Digital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате. DTS в домашних кинотеатрах используется максимальный битрейт 1,536 kbps (full bitrate), такой звук более качественный, чем AC-3 format от Dolby Digital. DTS - использует 6 свободных аудио дорожек и поддерживает систему распределения звука 7.1, при таком битрэйте DTS 4.0 - будет звучать также объемно, как и "Долби" 5.1.

Windows Media Audio (WMA)

Лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft.

Кодек является частью комплекта Windows Media Audio. Он бесплатный, однако формат, равно как и программа для кодирования являются закрытыми. Разумеется, версия существует только для платформы Windows.

В принципе, WMA Lossless подеерживает все необходимые функции: теги, высокие частоты семплирования, многоканальный звук (включая 7.1), трансляцию аудио через сеть и т.д. Кроме того, встроенная поддержка декодера в Windows Media Player избавляет пользователя от необходимости скачивать что-либо из Интернета для воспроизведения музыкального файла.

MP3 - (формат кодирования звуковой дорожки MPEG) - лицензируемый формат файла для хранения аудио-информации.

Самый популярный формат сжатия на сегодняшний день. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат.МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее.

JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества.

Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания.

Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

Vorbis - свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к МР3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение.ogg и называется двойным именем Ogg Vorbis.

На 2006 год распространён существенно меньше, чем MP3. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.

Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, дающую лучшую чёткость воспроизведения при равной плотности потока.

Формат не ограничивает пользователя только двумя аудиоканалами (стерео - левый и правый). Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio.

К тому же, формат Vorbis - «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно переходит в другой) - в итоге сохранится целостность звука.

Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект - в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.

Формат имеет гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Microsoft Windows, GNU/Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.

FLAC (англ. Free Lossless Audio Codec - свободный аудиокодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

FLAC является членом семейства кодеков, разрабатываемых Xiph.Org. К слову, в него же входит известный ogg vorbis – один из лучших lossy-алгоритмов сжатия музыки. В качестве контейнера для аудиоданных используется, разумеется, OGG (файлы с расширением.ogg) и ещё один open-source контейнер – Matroska (файлы с расширением.mka).

Сразу стоит отметить полную открытость как формата, так и алгоритма FLAC. Они не патентованы, поэтому могут совершенно безвозмездно использоваться в любых программах. Именно этим обусловлена широкая поддержка FLAC в проигрывателях – любой серьёзный плеер имеет плагин для FLAC. Кроме этого существуют аппаратные mp3-плееры с поддержкой кодека FLAC.

FLAC поддерживает теги собственного формата “FlacTags”. Есть возможность кодирования многоканального звука – серьёзное преимущество по сравнению с Monkey’s Audio. Формат поддерживает любые частоты семплирования в диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4-х (!) до 32-х бит.

Считается, что в сравнении с остальными lossless-кодеками FLAC наиболее эффективно расходует ресурсы системы при раскодировании (воспроизведении) аудио. К сожалению, это достигается за счёт значительного повышения времени кодирования (сжатия).

Сайт FLAC регулярно обновляется, выходят новые версии кодека. Вообще, по активности развития FLAC безусловно лидирует. Вполне возможно, что в будущем это сделает его основным форматом.

AAC (англ. Advanced Audio Coding) - формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).

AAC изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

Иногда компании создают свои проприетарные форматы, которые поддерживают только их собственные плееры. Apple Lossless был создан одноименной компанией для плеера iPod в качестве альтернативы FLAC, используемом на других плеерах. Если вы не используете iPod, то можете никогда не столкнуться с этим форматом.

Monkey"s Audio (APE)

Monkey"s Audio или APE (от английского ape - обезьяна) – популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и.apl для хранения метаданных. Несмотря на открытый исходный код, Monkey"s Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование.

Средний битрейт в аудиофайле составляет 600-700 кбит/с; сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 40-50 % в зависимости от жанра музыки: если классические или джазовые произведения сжимаются самым лучшим образом, то композиции в стиле trash-metal или что-то подобное «электронно шумовое» покажет наихудший результат. Для кодеков с потерями при приемлемом качестве сжатие составляет около 80 %.

Существуют четыре степени сжатия. Максимальная компрессия может показаться единственно верным решением, даже несмотря на довольно большое время сжатия. Однако нужно учитывать ещё и расход ресурсов системы, воспроизводящей файл, – для максимально сжатого файла он относительно высок.

Формат.APE обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции. Ещё одним плюсом является проверка целостности файла при раскодировании. Поддерживается восстановление оригинального wav-файла из сжатого.APE.

Monkey’s Audio имеет графический фронтэнд под Windows, иначе говоря удобную оконную программу для управления процессом кодирования. Остальные кодеки требуют использования командной строки или фронтэндов сторонних разработчиков. Самое приятное, что фронтэнд Monkey’s Audio можно использовать и с другими кодеками – Rkau, Wavpack, Shorten и даже lossy-кодеками mp3 и ogg vorbis.

Немного о недостатках. Кодек Monkey’s Audio существует только под Windows. Однако на сайте написано, что «версии под Mac и Linux уже разрабатываются». К слову сказать, сам сайт не обновлялся достаточно давно, что не является хорошим признаком. Также отсутствует какая-либо поддержка среди производителей аппаратных плееров.

MIDI (англ. Musical Instrument Digital Interface - цифровой интерфейс музыкальных инструментов) - стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

В отличие от других форматов, хранит не оцифрованный звук, а наборы команд (проигрываемые ноты, ссылки на проигрываемые инструменты, значения изменяемых параметров звука), которые могут воспроизводиться по-разному в зависимости от устройства воспроизведения. Удобство формата MIDI как формата представления данных позволяет реализовывать устройства, производящие автоматическую аранжировку по заданным аккордам, а также приложения 3D-визуализации звука. Кроме того, такие файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук сравнимого качества.

Статья взята с сайта cjcity.fdstar.ru

Просмотров