admin管理员组

文章数量:1531287

2024年6月28日发(作者:)

软件2012年第33卷第3期 S0FTWARE 国际IT传媒品牌 

基于多音轨MIDI主旋律提取的音乐可视化表达 

孙博文 张艳鹏 赵振国 高超 孟繁博 

(1.哈尔滨理工大学计算中心,哈尔滨150080I 2.哈尔滨理工大学计算机科学与技术学院,哈尔滨150080l 

3.哈尔滨理工大学应用科学学院,哈尔滨150080;4.哈尔滨理工大学电气学院,哈尔滨150080) 

摘要:本文以MIDI音乐为研究对象,以表达音乐主旨为前提,提出了一种基于主旋律提取的音乐可视化表达方法。通过对 

MIDI文件的特征识别,构造音乐主旋律的提取方法,并将提取出来的主旋律作为音乐视觉表现的主要对象,而其他非主旋律的音乐 

元素淡化辅助表示,从而实现更加准确表达音乐核心之目的,以达到更好的视听效果。 

关键词:音乐可视化;MIDI音乐;音乐特征提取;主旋律提取 

中图分类号:TP391 文献标识码:A DOI:10.3969 ̄.issn.1003—6970.2012.03.019 

Music Automatic Classification Approach Based on Fractal Dimension 

SUN Bo—wen ,ZHANG Yan.peng ,ZHAO Zhen.guo ,GAO Chao ,MENG Fan.bo 

(1.Computing Center,Harbin University ofScience and Technology,Harbin 150080; 

2.Computer Science and Technology,Harbin University ofScience and Technology,Harbin 1 50080; 

3.AppliedScience,Harbin Universiyt ofScience and Technology,Harbin 150080;4.Electric,Harbin Universiyt ofScience and Technology,Harbin 150080) 

[Abstract]This article takes MIni music as research object,on the premise ofexpressing music hetme and then put forward a meth- 

od which is based on the extraction of melody to express music visualization.Through the characteristics identification of MIDI,create a 

method of melody extraction.And the melody extracted from music represent as a visual object of music visualization.The other element 

will be represented lightly ̄So as to achieve a more accurate expression music core purposes and better audio-visual effects. 

[Key words]Music visualization;MIDI music;MIDI’S music feature extraction;melody extraction 

0 引 言 

音乐可视化(Music Visualization)是对音乐表达的一种 

非主观的解释和判断,是为理解、分析、比较音乐的表现力和内 

部结构提供的一种呈现技术…。它是跨音乐 数字音频、图形 

学、图像处理、虚拟现实等领域的又一新的研究方向,在娱乐、 

教育、艺术和商业中具有广阔的应用前景。作为一种全新的视 

为研究的数据源。 

1 多音轨MIni文本文档的创建 

1.1 MIDI的基本格式 

MIDI结构如下图1所示 。具体说明如下: 

个文件头块 多个音轨 

听技术,近年来,音乐可视化也引起了科研人员的密切关注。 

但是现今的音乐可视化方法多将各音乐元素看成整体进 

行统一展示,未能将主旋律与辅旋律区分开来,以至于无法突 

出音乐所要表现的主体内容。如:一些音乐中的激烈背景鼓点 

块标识 MTrk) 块长度 

块标识{MTrd) 块长度 格式信息 音乐头 MIDI事伺 

可能会掩盖同时出现的主旋律所要表达的可视化内容。 

鉴于此,本文提出了一种基于主旋律提取的音乐可视化表 

达方法,将音乐主旋律提取并进行突出可视化显示,同时辅以 

音乐的辅助旋律进行背景淡化显示。 

金毅等人通过研究指出 :从自然声音文件中提取旋律特 

征的处理过程复杂、难度高,精确度差。而结构化声音MIDI, 

其构造方式是以音乐元素的组织结构为基础的,所以为音乐特 

征的自动识别提供了极大的方便,因此本文选取MIDI乐曲作 

通道信息 系统信息 

通道模 通道声 系统一 系统实 系统专 

式信息 音信息 般信息 用信息 用信息 

图l MIDI音乐格式 

(1)文件头: 

十六进制代码为:4d 54 68 64l 00 o0 o0 06I ff ff 

nn nnI dd dd,其中: 

基金项目:全国大学生创新实验资助编号:(101021434) 

作者简介:孙博文(1963-),男,哈尔滨理工大学计算中心,副教授,音乐可视化及分形理论,sunbowen@hrbust.edu.CDI张艳鹏(1987-),男,哈尔滨 

理工大学计算机学院研究生,音乐可视化,yanpeng873@163.corn。 

软件杂志欢迎推荐投稿:http://www.ccomsof1.corn/ ・64 

软件 (您的文章得到院士的关注) 孙博文等:基于多音轨MIDI主旋律提取的音乐可视化表达 

(4)再下一行为音乐具体特征:如第二个字符1.220为音符 

开始时间,第三个字符E2代表音高,第四个字符V127代表音 

符力度值,第五个字符代表音符持续时间,第六个字符代表音 

色。 

・4d 54 68 64:前四个是ASCII字符“MThd”是用来 

鉴别是否MIDI文件。 

・00 00 00 06:指明文件头描述部分的字节数,它一定是6。 

・ff ff:文件的格式,有3种格式:0——单轨;1——多轨, 

同步;2——多轨,异步。 

・nn nn:MIDI文件中的轨道数。(注:MIDI的数据是由 

若干个格式相同的子数据构成的,这些子数据在多音轨的格式 

中记录了一个轨道的所有信息。多加一个音轨,就把数据追加 

在前一音轨的后面就可以了,同时更改此数据)。 

・dd dd:每个4分音符delta-time节奏数。 

(2)轨道块(数据描述) 

全局音轨:包括歌曲的附加信息(比如标题和版权)、歌曲 

速度和系统码(Sysx)等内容。音符音轨:包含音符信息的音轨。 

・4D 54 72 6B:不管是全局音轨还是含有音符的音轨, 

它其实是ASCII字符“MTrk”。 

・XX XX XX XX:其后跟着一个4个字节的整数,它标志 

图3 MIDI音乐特征文本 

了该轨道的字节数,这不包括前面的4个字节和本身的4个字节。 

・数据:接着是记录数据的地方了,每一个数据有着相同 

的结构:时间差+事件。 

3多音轨MIDI的主旋律提取 

采用MIDI音乐文件作为数据源,但MIDI文件几乎都是 

多音轨的,而且主旋律通常就隐藏在其中的某些音轨或音轨片 

段中 ,所以必须先对MIDI文件进行音轨分解,得出主旋律音 

轨才能为其所用。 

1.2文本文档创建 

为了便于提取MIDI的音乐特征,需要根据MIDI基本格 

式将二进制MIDI文件编译成为十进制文本文件(不破坏MIDI 

结构)。其基本原理是:将每8位二进制位对应一个十进制数, 

逐个翻译。图2为乐曲((Canon}}的十进制文本文件: 

本文采用文献[6]提出的基于H—K算法的MIDI音乐主 

旋律提取方法来提取MIDI主旋律。H—K算法针对两类或多 

类分类问题,在特征空间中寻找一个最优的超平面作为两类的 

分割平面川。此方法具有有效性及可行性,并且计算简单,易于 

实现,对于主旋律分布于一个音轨上的MIDI音乐有很高的准 

确性。具体做法如下: 

(1)根据文献[6]提供的公式从MIDI文件中计算并提取 

相应特征,包括:左右声道平衡度,音量,音长,力度,音高,音 

程。 

(2)H—K算法的主旋律提取: 

①应用文献[8】中提到的一些基本的主旋律判别方法排除 

下明显不是主旋律的音轨,这样做可以提高算法的准确性。 

②由左右声道平衡度、音量、音长、力度、音高和音程构 

成一个6维特征空间,音乐特征矢量x--(xl, 2, , 4, 5,x6) 

2多音轨MIDI特征提取 

基于上节所述MIDI音乐结构特征规则标记,从已经转译 

的十进制文本文件中提取出各个音轨信息,包括:节拍,开始时 

间,音高,力度,持续时间,音色。构建MIDI音乐特征文本。图 

3为MIDI音乐特征文本。说明如下: 

(1)第一行为这首音乐每节的单元数。 

(2)第二行为第一音轨开始标记。 

对应于特征空间中的一个点,运用已知的样本进行学习产生 

个最优超平面d(x)--WoX+W -0,将特征空间划分成两个子 

区域,使不同模式类分布在不同的子区域中并将特征量符号 

规范化得到特征量增广矩阵X,引入N维余矢量b>O,于是 

不等式方程组变为:w ≥b>O。使用平方误差标准函数: 

. 

2 

J(w,b) Ilwo’ —bI ∑( 薯一 )==>minH—K算法将准则 

l 

函数 十)视作W和b的函数,在迭代过程中不断修正w并调整 

6,最终求得准则函数J关于W和b的极小值点,作为判断主旋 

律音轨的依据。 

(3)第三行开始分节拍显示,M001代表第一节拍,后边的 

1/2代表1/2拍。 

软件杂志欢迎推荐投稿:http://www.ccomsoft.com/ 

本文标签: 音乐主旋律提取