admin管理员组

文章数量:1538361

2024年4月23日发(作者:)

音频基本知识

第一部分 模拟声音-数字声音原理

第二部分 音频压缩编码

第三部分 和弦铃声格式

第四部分 单声道、立体声和环绕声

第五部分 3D环绕声技术

第六部分 数字音频格式和数字音频接口

第一部分 模拟声音-数字声音原理

一、模拟声音数字化原理

声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,

音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模

拟信号。

图1 模拟声音数字化的过程

声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散化通

过采样来实现。

声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(

f

s

)

是多少,②每个声音样本的位数(bit)应该是多少,也就是量化位数。

¾ 采样频率

奈奎斯特理论(采样定理)指出,采样频率不应低于声音信号最高频率的两倍,这样才

能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在

一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2

个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至

少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率

为44.1kHz。电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。

常见的音频录制时的采样率和量化位数:

镭射碟

DVD

声音录制格式

杜比数字

线性PCM

从数字音频接口输入输出

杜比数字位信号

线性PCM(48kHz采样/16bit或

48KHz采样/24bit等)

CD

VCD

线性PCM

MPEG

线性PCM(44.1kHz采样/16bit)

线性PCM(44.1kHz采样/16bit)

表1 常见音频录制及传输格式

¾ 量化精度

光有频率信息是不够的,我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的

等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我

们常见的CD位16bit的采样精度,即音量等级个数有2的16次方。样本位数的大小影响到

声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。

¾ 压缩编码

经过采样、量化得到的PCM数据就是数字音频信号了,可直接在计算机中传输和存储。

但是这些数据的体积太庞大了!为了便于存储和传输,就需要进一步压缩,就出现了各种压

缩算法,将PCM转换为MP3,AAC,WMA等格式。

二、问题

1、音频压缩技术有多重要?

我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比:

PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数

据速率则为 44.1K×16×2 =1411.2 Kbps,这个参数也被称为数据带宽。再除以8将bit

换算成字节byte,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM

编码的音频信号,需要176.4KB的空间。

MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为

128Kbps/8=16KB/s。如下表所示:

音频格式

CD(线性PCM)

MP3

AAC

mp3PRO

WMA

比特率

1411.2 Kbps

128Kbps

96Kbps

64Kbps

64Kbps

存1秒音频数据所占空间

176.4KB

16KB

12KB

8KB

8KB

本文标签: 声音采样频率音频数据