[数字音频处理] 分贝/赫兹/频谱/采样 原理与概念 (Section 1)

您所在的位置:网站首页 30赫兹声音播放 [数字音频处理] 分贝/赫兹/频谱/采样 原理与概念 (Section 1)

[数字音频处理] 分贝/赫兹/频谱/采样 原理与概念 (Section 1)

2024-07-01 15:30| 来源: 网络整理| 查看: 265

目录

#️ 分贝(Decibel)

#️ 赫兹(Hertz)

#️ 声音频谱(Sound Spectrum)

#️ 采样率(Sampling Rate)

#️ 采样位(Sampling Bit)

在数字音频中,声音信号的可视化观测属性单位为响度(分贝)与频率(赫兹)。

分贝(Decibel)

分贝是量度两个相同单位之数量比例的计量单位,主要用于度量声音强度,常用dB表示。换句话说,在使用分贝时,表达的是对于两事物的比较,度量一个事物相对于另一个事物某一个量的比率。这个量即计量单位,可以是功率、场强或声压。

—————— ✨例子  ——————

例如枪声的响度是140dB,这表达的是子弹发射产生的声压之比,与其进行度量比较的是人类的听觉响度阈值(即门槛)0dB,相对于此,枪声的声压即为其的+140%。 

————————————————

在数字音频处理中,理论上声音信号的量程为[-∞,0]dB,我们常用音量表(VU meter)来观察声音的响度,使用推子(Fader)将声音信号进行增加和减弱。

某一类音量表(VU meter)

1️⃣音量表(VU meter)

声音信号在0dB时为满量程(Full scale),也称作DBFS(Decibel Full Scale) 或 LUFS(LU指响度)。在实际中,超出0dB(LU)的信号将会被削减(Clipping),削减为一种失真形式,该失真与摇滚乐中的失真并不相同,我们在做音频处理时应尽量避免出现该类失真,有关为何会出现削减现象会在下文解释。

2️⃣推子(Fader)

在表盘中指的是对声音信号的响度进行增加或减弱,当推子位于0dB时,表示保持原声音信号响度输出,当推子大于0dB时,表示对信号进行增益,反之减弱。

赫兹(Hertz)

赫兹,是国际单位制中的频率单位,它是每秒钟的周期性变动重复次数的计量,表示物体每秒钟震动多少次。一般人耳能听到的最低频率为20Hz。

声音频率范围表 名称频率范围覆盖范围信息特点表达丰富时表达欠缺时

次低频

Sub Bass

20~40 Hz

次底鼓

钢琴极低音

——

力量感

难以听到

————

低频

Bass

40~250 Hz

底鼓、贝斯

低音提琴

——力度基础沉闷虚弱

中低频

Lo Mid

250~500 Hz

钢琴主区八度

人声

大部分

声音信息

声音基础浑浊单薄

中频

Mid

500~2k Hz

大多数乐器

人声

最详细

细节信息

声音主区听觉疲劳失去主体

中高频

Upper Mid

2k~4k Hz

人声、乐器音色

打击乐音色

音色

信息

音色特点杂乱单调

感知域

Presence

4k~6k Hz——

清晰度

信息

场景感知刺耳脆弱遥远沉闷

空气域

Air

6k~20k Hz——

谐波

信息

空灵空虚暗沉

声音频谱(Sound Spectrum)

自然界中的声音在数字音频上的可视化是通过声音频谱来实现的,在声音频谱显示器中,水平轴方向表示的是频率(Hz),垂直轴方向表示响度(振幅)(dB)。声音由基频(Fundamental frequency)和谐波(Harmonic wave)构成。

1️⃣基频(Fundamental frequency)

基频是声音的基准频率,一般为最低频率下振幅最高的点位(区位)。

2️⃣谐波(Harmonic wave)

谐波是在基频之外的高频率中的震动,能够帮助我们分辨乐器的音色

对于同一音调,不同乐器进行弹奏,其声音频谱基频相同,谐波不同。

—————— ✨例子  ——————

下图为使用钢琴和大提琴进行弹奏的A2(110Hz)音调频谱。红色框区域为基频,蓝色框区域为谐波。将两者频谱进行合并比较,可以发现其基频相同,故都是弹奏同一音调,但谐波不同,因为乐器的音色表现不同。

钢琴频谱 大提琴频谱

合并对照

————————————————

采样率(Sampling Rate)

采样频率,也称为采样速度或者采样率,定义了单位时间内从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机单位时间内能够采集多少个信号样本。

自然界中的声音信号为模拟信号,我们需要使用声卡将麦克风录制下来的模拟信号转换成数字信号,形成计算机可以识别的0和1数据。声卡中的模数转换器(ADC, Analog to Digital Converter)会以特定的时间或间隔对信号进行采样,这个间隔被称为采样率。一般家庭录音使用的采样率是44100Hz,即音频接口每秒对模拟信号进行44100次采样,然后将测量值样本转换为二进制数据并发送到计算机当中。播放计算机硬盘中存储的音频时,将二进制数据通过声卡进行数模转换,尽可能还原原始波形并输出。

采样位(Sampling Bit)

即采样值或取样值,用来衡量量化的参数,是指声卡数字信号的二进制位数。声卡的位客观地反映了对输入信号描述的准确程度。 声卡的主要的作用之一是录制与回放,在这个过程中采样的位数决定了采集的质量。

在采样时,如果采样位为4bit,则其振幅的取样值由四位二进制数字组成,即采样样本可表达为2^4=16个可能值,意味着样本的幅度只能表示为1到16的比例,声音频谱波形的垂直方向单位(幅度)最大值为16。采样位越高,则信号处理的分辨率和保真率也就越高,所以我们往往需要更高的采样率(次数)或采样位(深度)。大多数家庭录音的采样位为16bit,专业录音室往往使用32bit的采样位,来保证准确地重塑原始的音频信号。

在数字音频处理中,我们应尽量避免信号幅度超过采样位取样值的最大值,当信号幅度超出最大值时,系统将无法表达这些数据,并默认以最大值进行返回,因此,波形在超过最大值时将会被截断,即削波(Clipping)。

在大多数音量表中,出现削波的部分会用红色或橙色来表示。

End

参考数据:

百度百科-分别;百度百科-赫兹;百度百科-采样;Presonus Studio One。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3