admin管理员组

文章数量:1536149

2024年6月12日发(作者:)

常见的音频编码标准

在自然界中人类能够听到的所有声音都称之为音频,它可能包括噪音、 声音被录制下

来以后,无论是说话声、歌声、乐器都可以通过数字音乐软件处理。把它制作成CD,这时

候所有的声音没有改变,因为CD本来就是音频文件的一种类型。而音频只是储存在计算机

里的声音。 演讲和音乐,如果有计算机加上相应的音频卡 ,我们可以把所有的声音录制下

来,声音的声学特性,音的高低都可以用计算机硬盘文件的方式储存下来。反过来,我们也

可以把储存下来的音频文件通过一定的音频程序播放,还原以前录下的声音。自然界中的声

音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通

过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。然而,3G网络带来

了移动多媒体业务的蓬勃发展,视频、音频编解码标准是多媒体应用的基础性标准,但其种

类较多,有繁花渐欲迷人眼之感。那么常见的编码技术就是我们必须知道的,下面我们介绍

一下最常见的编码技术。

PCM 脉冲编码调制是Pulse Code Modulation的缩写。PCM编码的最大的优点就是音质

好,最大的缺点就是体积大。我们常见的Audio CD就采用了PCM编码,一张光盘的容量

只能容纳72分钟的音乐信息。

WAV是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个

格式已经成为了事实上的通用音频格式。实际上是Apple电脑的AIFF格式的克隆。通常我

们使用WAV格式都是用来保存一些没有压缩的音频,但实际上WAV格式的设计是非常灵

活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你

甚至可以在WAV格式里面存放图像。之所以能这样,是因为WAV文件里面存放的每一块

数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。在WINDOWS

平台上通过ACM(Audio Compression Manager)结构及相应的驱动程序(通常称为CODEC,

编码/解码器),可以在WAV文件中存放超过20种的压缩格式,比如ADPCM、GSM、CCITT

G.711、G.723等等,当然也包括MP3格式。

虽然WAV文件可以存放压缩音频甚至MP3,但由于它本身的结构注定了它的用途是存

放音频数据并用作进一步的处理,而不是像MP3那样用于聆听。目前所有的音频播放软件

和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。这些软件包括:Sound

Forge, Cool Edit Pro, 等等。

3

MP3它的全称是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年

由德国夫朗和费研究院和法国汤姆生公司合作发展成功。刚出现时它的编码技术并不完善,

它更像一个编码标准框架,留待人们去完善。这个比喻相信大家都会同意。MP3是

Fraunhofer-IIS研究的研究成果。MP3是第一个实用的有损音频压缩编码。在MP3出现之前,

一般的音频编码即使以有损方式进行压缩能达到4:1的压缩比例已经非常不错了。但是,

MP3可以实现12:1的压缩比例,这使得MP3迅速地流行起来。MP3之所以能够达到如此

高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了

人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量。

由于MP3是世界上第一个有损压缩的编码方案,所以可以说所有的播放软件都支持它,

否则就根本没有生命力。在制作方面,也曾经产生了许多第三方的编码工具。不过随着后来

Fraunhofer-IIS宣布对编码器征收版税之后很多都消失了。目前属于开放源代码并且免费的

编码器是LAME (Lame Ain't MP3 Encoder,)。这个工具蔥x]系难顾跻糁首詈玫腗P3压缩

工具。另外,几乎所有的音频编辑工具都支持打开和保存MP3文件。

Media

互联网大行其道之后,Real Media 出现了。这种文件格式几乎成了网络流媒体的代名

词。RA、RMA这两个文件类型就是Real Media里面向音频方面的。它是由Real Networks

公司发明的,特点是可以在非常低的带宽下(低达28.8kbps)提供足够好的音质让用户能在

线聆听。

网络流媒体的道理其实非常简单,简单说就是将原来连续不断的音频分割成一个一个带

有顺序标记的小数据包,将这些小数据包通过网络进行传递,在接收的时候再将这些数据包

重新按顺序组织起来播放。如果网络质量太差,有些数据包收不到或者延缓了到达,它就跳

过这些数据包不播放,以保证用户在聆听的内容是基本连续的。就是这么简单的道理,促成

了网络上的又一个传奇。

由于Real Media是从极差的网络环境下发展过来的,所以Real Media的音质并不怎样,

包括在高比特率的时候,甚至差于MP3。特别是有相当长的一段时间Real Networks公司只

顾着往Real Media里面加入各种各样的新特性比如广告插播什么的,而忽略了随着网络速

度的提升和宽带网的普及,用户对质量的要求也不断提高。后来Real Networks通过与SONY

公司合作,利用SONY的ATRAC技术,也就是MD的压缩技术)实现高比特率的高保真

压缩,但这些举措始终都带给用户一个姗姗来迟的感觉。由于Real Media的用途是在线聆

听,并不适于编辑,所以相应的处理软件并不多。一些主流软件可以支持Real Media的读/

写,可以实现直接剪辑的软件是Real Networks自己提供的捆绑在Real Media Encoder编码

器中的Real Media Editor。但功能非常有限。这一点与现在的Windows Media相比是两个世

界。

即Windows Media Audio,任何事情都少不了Microsoft的份。在意识到网络流媒体之于

互联网的重要性之后,Microsoft立马就推出了Windows Media与Real Media相抗衡,同时

开始对其他音频压缩技术说不:一律不提供直接支持。到了Windows XP版本还把原来提供

的MP3压缩功能都拿掉了。

Windows Media Audio(/windows/windowsmedia)也是一种网络流

媒体技术,本质上跟Real Media是相同的。但Real Media是有限开放的技术,比如rtsp(Real

Time Stream Protocol实时流协议)这样的网络传输协议是提交到网络工作组RFC网络协议

集的其中一个(编号RFC2326),而Windows Media则没有公开任何技术细节,据称是为了

更好地进行版权保护,因此要完全封闭,还创造出一种名为mms(Multi-Media Stream多媒

体流)的传输协议。

MIDI技术本来不是为了电脑发明的。该技术最初应用在电子乐器上用来记录乐手的弹

奏,以便以后重播。不过随着在电脑里面引入了支持MIDI合成的声音卡之后MIDI才正式

地成为了一种音频格式。有很多人都误以为MIDI是用来记谱的,这是错的。MIDI的内容

除了乐谱之外还记录了每个音符的弹奏方法,所以有些MIDI文件播放起来不好听,而某些

则有良好的效果。MIDI本身也有两个版本,General MIDI和General MIDI 2。在MIDI上还

衍生了许多第三方的非标准技术,比如非常著名的:X-MIDI(或者叫XG),这是由日本

YAMAHA公司(/)发明的,在原有的MIDI具有128种乐器的基础

上扩充到了512种,并增加了更多的演奏控制,配合YAMAHA自己的波表播放软件或支持

X-MIDI的硬件可以还原出非常动听和接近真实乐器效果的音乐。另外就是为了弥补MIDI

中通过声音合成得到的乐器声音始终比不上真实乐器声音这一缺点而由General MIDI

本文标签: 音频编码声音压缩网络