Что такое звукорежиссура
Что такое звук
 
 
 
Часть 3
 
 
Какой нужен компьютер
Выбор звуковой карты
Настройка задержки в Linux и Windows
Нужен ли вам микшер?
Микрофон
Наушники
Что такое MIDI
Программы
DAW - основа студии
DAW Reaper - сведение музыки
Тонкости работы с DAW
Волновые редакторы
Запись
Сведение
Рождение звука :-)
Частотные диапазоны
Разъемы и их названия
Что такое фаза
Переоцифровка в картах от Creative
Несколько звуковых карт в Linux
Быстрый рендеринг MIDI в WAV

<<< Карта сайта >>>

Все вопросы и пожелания пишите в гостевой!

 

 

Звукорежиссура

Что такое звук. Часть 3.

Вернемся к нашим числам с плавающей точкой. Они состоят из мантиссы и порядка. Мантисса - это то самое число, которое надо умножить на 10. А порядок (часто его называют "экспонента") - показатель степени. Из примера выше очевидно, что мантиссой будет число 6.320050628227, а порядком - то, что стоит после буквы E - 21. Еще в числе с плавающей запятой существуют два дополнительных поля - для хранения знака мантиссы (плюс или минус) и знака порядка. Диапазон чисел, представляемых типом float, лежит в границах между 3.14E-38 до 3.14E+38. Каждый сэмпл типа float занимает 32 бита, или 4 байта.

В цифровом звуке, при представлении сэмпла числом с плавающей запятой, значение обычно нормализируют - помещают на отрезок от -1.0 до +1.0. Помним, что числа здесь - условности, обозначающие что нам угодно. И угодно нам, чтобы весь диапазон возможных дробных чисел между -1.0 от +1.0 был пригоден для обозначения уровня громкости. Например, сэмпл может быть равен 0.354345.

Выходит, что значения порядка играют роль в вычислениях только при выходе за границы диапазона - получается как бы запас. В 32-битных числах типа float мантисса занимает 24 бита (1 бит, впрочем, расходуется под знак находящегося там числа). Принимая во внимание диапазон возможных значений от -1.0..+1.0, мы можем считать, что по точности представления звука формат float подобен целочисленному 24-битному, однако с поправкой на большой запас запас диапазона в случае выхода за рамки -1.0..+1.0.

Существуют простые способы перевода из одного формата чисел в другой. Например, чтобы 16-битный целочисленный знаковый сэмпл превратить во float, надо разделить значение сэмпла на 32768. А что перевести из float обратно, надо умножить число на 32767.

При целочисленном формате сэмплов мы наблюдаем четкую зависимость ширины динамического диапазона от битовой глубины. Так, в 16 бит помещается динамический диапазон в 96 децибел - каким образом это вычисляется, я расскажу чуть позже.

Что такое децибел (обозначается как дБ или dB)? Все говорят "столько-то" децибел, когда хотят обозначить громкость. Децибел сам по себе не означает четко определенную меру чего-либо. Мы можем сказать: "10 спичек", и это будет означать, что у нас есть 10 спичек. В то время как 10 децибел будут только десятью условными уровнями громкости, каждый из которых вычислен по определенной формуле.

Вот вам довольно корявый сравнительный пример. Придумаю лучше - заменю. Стоят в ряд десять человек, каждый из которых - вот вам и формула - может поднять в столько-то раз больше, чем стоящий рядом. Этих-то людей и можно назвать децибелами. Третий чувак поднимает столько-то, пятый - столько-то, но его сила подчинена формуле, по которой вычисляется - во сколько именно раз. Это очень приблизительный пример.

И чтобы обозначить некую силу, мы не будем говорить - вот эта сила поднимает столько-то, а просто скажем - пятый человек, или - пять децибел. Так же и цифровом звуке. По формуле, с которой вы познакомитесь чуть позже, вполне материальные уровни громкости (числа, записанные в сэмплах) переводятся в децибелы. И мы измеряем громкость уже не в громадных числах-сэмплах, чей диапазон зависит от битовой глубины, а в децибелах, которых получается не так уж много - для 16 бит их всего 96. Вместо 65535 "настоящих" уровней у нас только 96 условных и отсчет идет ниже нуля, то есть 0 dB - наибольшая громкость. Полное обозначение таких "цифровых" децибелов - не просто dB, а dBFS (FS означает тут Full Scale, т.е. полный диапазон).

Однако децибелы используются и для измерения громкости иной природы. Например, уровни громкости в "электрическом" звуке - том, что идет, например, от плейера в наушники, или от микрофона к микшеру или звуковой карте - по своей природе являются изменениями электрического напряжения. Такой "электрический" децибел называется dBu, который зависит количества вольт. Есть еще dB SPL (sound pressure levels) - децибелы звукового давления - тех самых изменений плотности воздуха. Измеряются они в положительную сторону. 0 dB SPL - порог слуха. Шепот в библиотеке, с пяти метров - 30 db SPL.

Средний по громкости рок-концерт или дискотека - около 110 db SPL. Шум внутри вагона метро - 100. Запуск ракеты - 180. Внутри дома ночью - 20. Обычный разговор - 60. Болевой порог - 120. За один dB SPL обычно принимается давление в 20 микропаскалей. dBm - для мощности звука, для вычислений таких децибел используются величины в Ваттах.

В акустике, вольты переводятся в децибелы по формуле: dB = 20 * log10(V1 / V2)

Пояснения. Чему тут равен наш dB? Он получается по формуле, где мы число 20 умножаем на десятичный логарифм отношения между значениями V1 и V2. V1 это измеряемое значение - текущий уровень сигнала, сколь сильно он отличен от нуля. А V2 это опорное значение - нулевой уровень сигнала (либо уровень, принятый за нулевой).

Вспомним, что такое логарифм. Логарифмом числа А называют степень, в которую надо возвести число Б (называемое основанием логарифма), чтобы получилось число А. Логарифм для 100 по основанию 10 равен 2. Здесь 10 - основание. Его мы возводим в квадрат (то есть во вторую степень, вот почему логарифм равен двойке) - 102 - то получаем искомые 100. Основание десятичного логарифма - 10, поэтому он и записан в формуле как log10. Еще примеры (в скобках указываем, логарифм какого числа мы хотим получить):

log10(10) = 1
log10(100) = 2
log10(1000) = 3

Мы хотим получить логарифм не чисел 10, 100 или 1000 из примеров выше, а из числа, которое является отношением между числами V1 и V2. Отношение эти вычисляется обычным делением V1 на V2. Это я условно пишу V1, V2 - на самом деле при "решении" формулы подставляются вполне осязаемые цифры.

В цифровом звуке формула, по которой мы можем перевести сэмплы в децибелы, выглядит так же: dB = 20 * log10(V1 / V2)

Но V1 и V2 уже не вольтаж, а значения сэмплов! Значение этого V1 равно значению сэмпла - именно одного из тех "кадриков"-ячеек, куда записывались уровни громкости при "замерах" - при оцифровке. У нас были вполне конкретные изменения электрического напряжения, поступившего на вход звуковухи. Аналогово-цифровой конвертер перевел нам эти изменения в числа, обозначающие уровни сигнала. Теперь этими числами мы можем оперировать, чтобы вычислять децибелы для обозначения громкости звука в децибелах в такое-то время звучания сигнала.

Хорошо, а что такое V2? При вычислении V2 программа подставит число, наибольшее для текущей разрядности сэмпла. Например, для 16-битного беззнакового сэмпла это будет 65535 (в ячейке памяти размером в 16-бит могут помещаться числа от 0 до 65535). Это же 65535 является и самым громким, наибольшим уровнем звука, оцифрованным в 16 бит. А для float таким числом будет 1.0 - то бишь верхняя граница нашего исходного диапазона от -1.0 до 1.0.

По нашей формуле, самый громкий уровень в переводе на децибелы равен нулю: 20 * log10 (65535 / 65535) = 0.

И по этой же формуле, наименьший уровень, отличный от тишины, будет для 16-битного сэмпла равен -96 dB, смотрите: 20 * log10 (1 / 65535) = -96. Мы берем самый тихий возможный сэмпл, равный единице, делим его на наибольший возможный, затем вычисляем для полученного числа десятичный логарифм, и умножаем на его 20. Готово! По той же формуле, для 24 битного звука нижняя граница опустится до -144 децибел. Такие граничные значения, как -96 или -144 dB называются динамическим диапазоном.

Часть 4 >>>

Автор: Петр Семилетов
ИСТОЧНИК: http://soundheresy.ho.ua/

 

 

 
Copyright © 2009- "Almanac"
Rambler's Top100