Что такое звукорежиссура
Что такое звук
Какой нужен компьютер
Выбор звуковой карты
Настройка задержки в Linux и Windows
Нужен ли вам микшер?
Микрофон
Наушники
Что такое MIDI
Программы
 
 
О форматах
часть 1
 
 
DAW - основа студии
DAW Reaper - сведение музыки
Тонкости работы с DAW
Волновые редакторы
Запись
Сведение
Рождение звука :-)
Частотные диапазоны
Разъемы и их названия
Что такое фаза
Переоцифровка в картах от Creative
Несколько звуковых карт в Linux
Быстрый рендеринг MIDI в WAV

<<< Карта сайта >>>

Все вопросы и пожелания пишите в гостевой!

 

 

Звукорежиссура

Программы. О форматах. Часть 1.

WAV - при звукозаписи и сведении вы чаще всего будете работать именно с форматом WAV. Произносится он правильно как "вэйв", но у нас говорят и вав, и вавчик, и волновой файл. Вав - довольно гибкий формат, он может содержать в себе как сжатый (например, алгоритмом MP3) звук, так и звук без сжатия - так называемый PCM (pulse-code modulation). Вавы, где звук на самом деле сжат в MP3, иногда встречаются на пиратских дисках с классикой. Но обычно под вавом подразумевают несжатый звук.

Причем с разными параметрами данных. Так, вавы, готовые для заливки на аудиодиск, должны быть в 16 бит 44.1 килогерца. Для подготовки дорожек для монтируемого DVD-фильма вам будут нужны вавы уже в 48 килогерц, и можно 24 бита, хотя чаще используется все же 16. В сети зачастую лежат вавы самого похабного звучания - восьмибитные, с частотой оцифровки 11 или 22 килогерца. Максимальный размер вава - 4 гигабайт. Если вам нужен вав большего размера, используйте формат Wav64. 64 не значит, что эти файлы используют битовую глубину 64 (хотя могут). Обратите внимание, что на флэшку с файловой системой FAT не помещаются файлы размером более 4 гигабайт. Такие файлы, однако, можно разрезать на куски в каком-нибудь файловом приказчике вроде Total Commander или Krusader, а потом собрать воедино при сбросе на винчестер.

MP3, или, говоря научно - MPEG-1 Audio Layer 3 - пожалуй, самый популярный формат. Для прослушивания музыки, однако не для звукозаписи. Как вы думаете, почему одна и та же песня в MP3 и WAV в десятки раз отличается по объему занимаемого пространства на диске? Потому, что MP3 - это звук, сжатый алгоритмами, которые подразумевают попросту выбрасывание тех частей звукового сигнала, которые не воспринимаются либо плохо воспринимаются человеческим ухом. Помимо убивания сигнала на определенных частотах, эти алгоритмы используют и более изощренные методы. Например, если в одном диапазоне частот сигнал слабый, а в соседнем диапазоне - сильнее, то первый будет выкинут из рассчёта на то, что человек всё равно услышит в основном только более сильный сигнал.

Следующая сатанинская тактика - joint stereo. Слово "joint" означает "объединенный". В joint stereo совмещено несколько средств. Одно из них - это искусственное превращение в моно низких частот обоих каналов, чтобы они занимали меньше места. В самом деле, низкие частоты чаще всего "расположены" по центру панорамы. Другой вид joint stereo - это Mid/Side (или M/S) stereo. В этом случае звук сжимается по такому принципу - если сигнал в левом и правом канале похож, то кодируются не левый и правый каналы, а "общая" середина и сигнал, который в этот общак не входит. Сжатие MP3 называют сжатием с потерями, или lossy. Любое кодирование звука в MP3 делает качество звучания хуже.

На качество звучания MP3 влияет битрейт - количество тысяч бит в секунду. То есть сколь многим или малыми количеством бит в секунду представлен сжатый звуковой сигнал. Меньше данных в секунду - больше степень сжатия.

В сети и на пиратских дисках чаще всего можно встретить музыку с битрейтом 128 kbit/s и 192. 192 звучит, понятное дело, лучше. Хотя теоретически может быть какой угодно битрейт, программы для кодирования в MP3 определяют обычно потолок в 320 kbit/s. После 320 качество не улучшается, скажем так. Для сравнения - битрейт на обычных, несжатых музыкальных CD - 1411.2 kbit/s.

Битрейт, постоянный на протяжении всей песни, называется Constant bitrate, или CBR. Есть еще переменный битрейт, VBR - Variable bit rate. Это когда битрейт меняется на протяжении песни. Программа-кодировщик при сжатии звука решает, каким участкам песни нужен высокий битрейт, а каким низкий. Допустим, зачем тишине высокий битрейт? На слух CBR и VBR почти не отличаются, если для сжатия был использован хороший кодек вроде LAME.

В MP3-файлы могут быть включены информационные тэги формата ID3. У формата несколько версий - ID3v1 и ID3v2. Обычно люди понимают под тэгами данные вроде названия песни или исполнителя. На деле же тэг - это структура с самыми различными сведениями, причем форматы их хранения в ID3v1 и ID3v2 различны. Что до названий песен и прочего, то в ID3v2 они хранятся в особых разделах, называемых кадрами. А в ID3v1 таких отдельных кадров нет, есть просто поля данных такого-то размера.

В ID3v1 для названия песни, группы и альбома отводится всего по 30 байт (читай - 30 букв), остальное просто обрубается. Столько же буковок отводится под комментарий. Также дается 4 буквы на год выпуска альбома, и еще 1 байт содержит в себе число, соответствующее музыкальному стилю. Стилей было предусмотрено аж 80, а проигрыватель Winamp расширил этот список пронумерованных стилей до 148. Чуть позже был разработан стандарт ID3v1.1, где от комментария отгрызли два байта и пустили их под другое поле - номер дорожки.

Названия песен, групп и альбомов в ID3v1.1 записываются в восьмибитной кодировке - по стандарту это должна быть кодировка ISO-8859-1, однако на деле используется стандартная кодировка системы. В Windows это "CP1251" (Code page 1251). Что значит "восьмибитная кодировка"? В компьютере каждая буква внутренне представлена не картинкой, которую мы видим на экране, а числом. Каждая буква алфавита пронумерована. Каждый номер хранится в ячейке памяти. У ячейки этой определенный размер. В восьмибитных кодировках этот размер равен 8 битам, или 1 байту. В байте могут храниться числа от 0 до 255. На первый взгляд, этого более чем достаточно для хранения целого алфавита! Но давайте посмотрим внимательнее.

Итак, строка чисел в восьмибитной кодировке - это последовательность ячеек памяти, в каждой из которых хранится число - номер буквы в некой таблице. Таблица соответствий букв и номеров и называется кодировкой.

В кодировке CP 1251 (она же Windows 1251) хранится не только русский алфавит. Во-первых, там есть латинский алфавит, причем отдельные ячейки занимают маленькие буквы, а отдельные - большие. То есть прописные и заглавные буквы имеют разные номера. Есть также куча служебных и невидимых символов. Русский алфавит в этой кодировке, в таблице, начинается только на номере 192 - это у заглавной буквы "А" такой номер. Маленькая буква "а" имеет уже другой номер - 224. И до предельного номера - 255 - не так уж далеко. Словом, в кодировку из 256 букв с трудом поместились служебные символы, латинский и русский алфавиты.

Теперь допустим, что у нас есть текст, где пёстрая смесь русский слов, немецких с умляутами, да еще испанский с их перевернутыми знаками вопроса. Значит надо, чтобы кодировка могла охватить все используемые в тексте алфавиты! А восьмибитная кодировка, любая, физически не вместит в себе одновременно и русскую, и немецкую, и испанскую, не говоря уже о китайских иероглифах. У нас есть только 256 номеров для букв! Как впихнуть?

Для этих целей была разработана кодировка Unicode, или Юникод. Вернее сказать, Юникод - это целая группа кодировок, есть всякие разновидности Юникода (UTF-8, UTF-16 и другие). Основной смысл в том, что в Юникоде каждый символ занимает уже не 1 байт, а более. Например, в UTF-16 у нас уже два байта, то есть 16 бит. Это позволяет нам охватить кодировкой до 65536 букв разных алфавитов! Более популярен другой подвид Юникода - UTF-8. В UTF-8, символ занимает 1 байт, если он является буквой латинского алфавита, и до 4 байт, если других алфавитов. UTF-8 - стандартная кодировка для Linux. Кроме того, в документах ODT и DocX текст хранится именно в UTF-8. С Юникодом у нас может быть много алфавитов в одном тексте - у кодировки хватит номеров на все буквы включенных в неё алфавитов. А это и девангари, и греческий, и арабский, и хирагана, и катакана, и всякие особые значки вроде Peace (может не отображаться в вашем браузере при некоторых шрифтах).

Какое отношение всё это имеет к MP3? Люди накапливали у себя на дисках коллекции эмпешек. Текст в тэгах был в разных кодировках, а проигрыватель-то поддерживает только одну - и благо, если можно её выбрать. А кодировка сначала была восьмибитная. И проигрыватель брал за образец одну какую-то кодировку, а надписи в других кодировках просто искажались при отображении на экране. Если в одной кодировке у русской "а" такой-то номер, то в другой кодировке под этим номером - совсем другая буква!

Появился новый стандарт тэгов - ID3v2. В первом его варианте поддерживалась кодировка UTF-16 и было снято ограничение на длину полей - то есть названия песен и групп могли превышать 30 букв. В самом свежем, за 2000 год варианте этого стандарта появилась поддержка кодировки UTF-8 - кстати, люди использовали UTF-8 тэги еще в первом варианте ID3v2, так что официальный стандарт просто догнал практику.

Если вы будете прописывать тэги в ID3v2, то ваша текстовая информация в MP3 не будет привязана к платформе, к операционной системе или настройкам пользователя. Один хороший, современный стандарт. Не только программные, но и "железные" плейеры переходят на поддержку ID3v2, не говоря уже о проигрывателях в мобилках и смартфонах. Так что прописывайте тэги именно в этом стандарте. Кстати, в MP3 файле могут быть одновременно тэги и в ID3v1, и в ID3v2. Тэги формата ID3v2 способны хранить в себе не только текст, но и картинки.

Из бесплатных программ для работы с тэгами могу советовать такие. Для Windows - MP3Tag, для Linux - EasyTag. Последний, кстати, умеет переводить тэги из одной кодировки в другую.

О форматах часть 2 >>>

Еще статьи по данной теме:

Программы.
Виртуальные инструменты и эффекты.

Автор: Петр Семилетов
ИСТОЧНИК: http://soundheresy.ho.ua/

 

 

 
Copyright © 2009- "Almanac"
Rambler's Top100