admin管理员组文章数量:1531442
2024年4月23日发(作者:)
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(21)申请号 CN2.9
(22)申请日 2014.05.30
(71)申请人 武汉大学
地址 430072 湖北省武汉市武昌区珞珈山武汉大学
(72)发明人 任延珍 蔡婷婷 熊浩 范梦迪
(74)专利代理机构 武汉科皓知识产权代理事务所(特殊普通合伙)
代理人 张火春
(51)
G10L19/018
权利要求说明书 说明书 幅图
(10)申请公布号 CN 103985389 A
(43)申请公布日 2014.08.13
(54)发明名称
一种针对AMR音频文件的隐写分
析方法
(57)摘要
本发明公开了一种针对AMR音频
文件的隐写分析方法,本发明深入挖掘了
AMR编码过程中的固定码本搜索原理以及
嵌入算法原理,发现现有基于轨道脉冲位
置调制的AMR隐写算法必然会破坏固定
码本搜索的脉冲固有特征,导致同轨道中
第一个脉冲位置和第二个脉冲位置之间具
有较强的相关性;本发明可应用于所有基
于脉冲位置调制的隐藏算法以及AMR-
NB、AMR-WB不同编码模式,G729、
G723.1等一类基于ACELP技术编码的压
缩语音隐写分析,具有广泛地通用性和较
高的检测正确率。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1.一种针对AMR音频文件的隐写分析方法,其特征在于,包括如下步骤:
步骤1.构建一个AMR自适应多速率语音编码音频样本库;随机选择一部分
步骤2.训练过程,包括如下步骤:
步骤2.1,输入训练样本集,对包括隐写音频和非隐写音频的训练样本集中所
有的训练音频进行解码,然后计算同轨道脉冲位置相同概率特征矢量
音频样本作为训练样本集,其余音频样本为待测样本集;
SPP;
步骤2.2,通过分类器对训练样本集中的所有训练音频的同轨道脉冲位置相同
步骤3.预测过程,包括以下步骤:
步骤3.1,解码待测样本集音频的帧,计算待测音频的同轨道脉冲位置相同概
步骤3.2,根据训练得到的分类model对待测音频的同轨道脉冲位置相同概率
其中,同轨道脉冲位置相同概率特征SPP,具体实现方式如下:
1.对于一个AMR压缩音频的比特流,假定其包含的子帧总数为Nf,
每个子帧 中脉冲数量为Np,每个子帧中轨道数量为
特征SPP进行预测,判断是否为隐写音频;
率特征SPP;
概率特征矢量SPP进行训练得到分类model;
Nt,每个轨道中脉冲的数量为Np_t,
AMR音频的每个子帧,提取其非零脉冲位置参数;
解码
2.若整段音频信号中同一轨道两个非零脉冲位置同时出现的概率PCP,则轨道
mo>
mrow> n> w> o>, o> h> 其中,0≤t≤Nt-1;i,j为轨道t中可选脉冲位置,1≤i,j≤Np; f为子帧序 号,1≤f≤Nf;ia为轨道t中第 脉冲的 t的PCP矩阵计算如下: 一个非零脉冲的位置,ib为轨道t中第二个非零 位置,P是一个子帧中同一轨道两个非零脉冲位置同时出现的概率; 3.若整段音频信号中同一轨道两个非零脉冲位置相同概率为SPP,则轨道t中 SPPt(i)=PCPt(i,i) 每个脉冲位置i的SPP值计算如下式: 待测音频的特征SPP= {SPPt(i)|1≤i≤Np,i≠First_Pos(t),0≤t≤Nt-1},其中, 1≤i≤Np,First_Pos(t)为轨道t的第一个可选脉冲位 置。 说 明 书 技术领域 本发明涉及数字音频信息隐藏领域,尤其涉及一种基于AMR音频轨道脉冲位置调 制隐 背景技术 公知,随着移动互联网音频应用业务的飞速发展,各种压缩音频文件在internet中 被分享 和传播,数字化语音在通信系统中所占的比重越来越大。作为 终端主流语音编码标准,自适应多速率语 码[1],可对16bit量 写的通用隐写分析方法。 3GPP组织指定的第三代移动 音编码AMR的应用非常广泛。其开源c编解码源 化无压缩的PCM语音信号,如网络公开的WAV数据库[2][3]以及采用录 音软件如cooledit[4]录制的PCM音频,进行不同模式下的编解码,以适应 宽。各种手机终端系统,如iPhone,Samsung,Nokia 如QQ,WeChat,都支持 也逐渐 不同的网络传输带 等,以及一些主流的移动终端通信软件, AMR语音格式。与此同时,面向压缩音频格式的隐写算法和工具 涌现,基于脉冲位置调制的AMR隐写算法具有嵌入容量高和隐蔽性良好的特性, 因 此给语音内容的安全通信带来隐患,同时给音频隐写分析也带来了新 的挑战。 隐写分析技术(Steganalysis)是信息隐藏的对抗技术,通过对载体固有统计特性和隐 写引起 载体特性细微改变的分析,检测数字图像、音频、视频等载体 秘通信的行为,从而达到对载密信息的破 法的不断发展,近年 信息中是否存在隐秘信息和隐 坏、检测、甚至提取秘密信息的目的。随着隐写算 来针对压缩音频的隐写分析算法也不断出现,但主要集中在Mp3和AAC 音频压缩格式的隐写分析算法,目前还没有针对AMR压缩音频隐写分析的 公开文献发表。 现有AMR隐藏算法都是基于其编码过程中固定码本搜索采用的深度优先树搜索方 式是 不彻底的搜索,导致选出的码本矢量是次优的,意味着固定码本参数 有其它可选空间,因此可以通过控制固定码本搜 一个脉冲位置中,并建立脉 2008 存在很大的冗余度,还 索策略,将秘密信息嵌入到每个轨道的最后 冲位置与隐藏信息之间的映射关系,实现秘密信息的嵌入和提取。 年Geiser B[5]率先提出针对AMR-NB12.2kbit/s的隐写方法,限制每个轨道的第二 个脉 冲位置由同轨道第一个脉冲位置和秘密信息共同决定,嵌入容量高的 年Miao[6]等人基于文献[5]的嵌入原理,提出一 同时计算复杂度低。2013 种面向AMR-WB自适应次优脉冲组合限制 的隐写算法,其应用范围广,同样适用于AMR-NB。这类嵌入算法嵌入容 12.2kbit/s模式下最大嵌入3kbps的秘密信息, AMR音频的隐写分析技术 量大,可在AMR-NB 同时不带来明显的听觉质量的降低。因此针对 研究具有非常重要和迫切的需求。 参考文献: [1](2010).ANSI-C code for the floating-point Adaptive Multi- Rate(AMR)speech codec[OnLine]. [2](2010,June).Mandatory speech codec speech processing functions,Adaptive Multi- Rate(AMR) [3](2007,Oct).CMU audio databases[OnLine].Available: /databases/ speech codec test sequences[OnLine].Available:/DynaReport / Available:/DynaReport/ [4](2012,Mar).Adobe Audition CS6[OnLine].Available: [5]Geiser B,Vary rate data hiding in ACELP speech codecs[C]//Acoustics,Speech and Signal Processing, International Conference ,20 [6]Miao H,Huang L,Chen Z,et al.A new scheme for covert communication via3G speech[J].Computers&Electrical Engineering,2012,38(6):1490- 08:4005-4008. encoded 1501. 发明内容 本发明为了解决上述的技术问题,提出了一种针对AMR音频文件的隐写分析方法。 本发明的技术方案是:一种针对AMR音频文件的隐写分析方法,包括如下步骤: 步骤1.构建一个AMR自适应多速率语音编码音频样本库;随机选择一部分音频样 本作 步骤2.训练过程,包括如下步骤: 步骤2.1,输入训练样本集,对包括隐写音频和非隐写音频的训练样本集中所有的 训练音 步骤2.2,通过分类器对训练样本集中的所有训练音频的同轨道脉冲位置相同概率 频进行解码,然后计算同轨道脉冲位置相同概率特征矢量SPP; 为训练样本集,其余音频样本为待测样本集; /cfusion/tdrc/?product=audition&loc=cn 特征矢 量SPP进行训练得到分类model; 步骤3.预测过程,包括以下步骤: 步骤3.1,解码待测样本集音频的帧,计算待测音频的同轨道脉冲位置相同概率特 征SPP; 步骤3.2,根据训练得到的分类model对待测音频的同轨道脉冲位置相同概率特征 SPP 其中,同轨道脉冲位置相同概率特征SPP,具体实现方式如下: 1.对于一个AMR压缩音频的比特流,假定其包含的子帧总数为Nf, 每个子帧中脉冲数 量为Np,每个子帧中轨道数量为 进行预测,判断是否为隐写音频; Nt,每个轨道中脉冲的数量为Np_t,解码AMR音频的每 2.若整段音频信号中同一轨道两个非零脉冲位置同时出现的概率PCP,则轨道t的 PCP mo> mrow> n> w> o>, o> h> 矩阵计算如下: 个子帧,提取其非零脉冲位置参数; 其中,0≤t≤Nt-1;i,j为轨道t中可选脉冲位置,1≤i,j≤Np; f为子帧序号,1≤f≤Nf; ia为轨道t中第一个非 零脉冲的位置,ib为轨道t中第二个非零脉冲的位置,P是一个子帧中 3.若整段音频信号中同一轨道两个非零脉冲位置相同概率为SPP,则轨道t中每个 脉冲位 SPPt(i)=PCPt(i,i) 待测音频的特征SPP= {SPPt(i)|1≤i≤Np,i≠First_Pos(t),0≤t≤Nt-1},其中, 1≤i≤Np, 本发明的有益效果是: 1、通用性强;本发明的隐写分析方法把编码过程中的固定码本搜索原理和脉冲位 置调制 嵌入原理相结合,从根本上反映了基于脉冲位置隐写的实质, 语音基于脉冲位置调制的隐写方法都可适 AMR-NB标准的音 First_Pos(t)为轨道t的第一个可选脉冲位置, 置i的SPP值计算如下式: 同一轨道两个非零脉冲位置同时出现的概率 对依ACELP技术编码的压缩 用,因此具有广泛的通用性;本发明中虽然是采用 频来作分析的,但也可应用在AMR-WB、G729、G723.1等音频标准之上。 2、检测率高;本发明通过对大量不同来源的AMR音频样本的测试,采用现有基 于轨道 脉冲位置调制的AMR隐写算法,在不同嵌入率、不同编码模 测性能进行了综合实验评估;实验结果表式、不同嵌入参数情况下的检 明,本发明所提特征对基于脉冲位置调制的隐写算 法有很好的检测性能,在嵌入率为30%以上时,载密音频的检测正确率高 频的检测正确率高于90%,针对网络AMR音频的检测 写检测性能。 于85%,对载体音 正确率为83.8%,因此具备良好的隐 附图说明 图1是本发明的流程图; 图2是本发明的特征提取流程图。 具体实施方式 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于 此。 本发明提供的一种AMR音频隐写分析方法,针对AMR音频隐写的特点,从固定 码本的 搜索原理入手,提出基于脉冲位置相同概率的AMR隐写分析 类的方法实现,包括训练过程和预测过程。 并采用分类器训练得 算法。算法的检测通过模式分 训练过程包括对训练样本集中所有音频提取特征 到分类model;预测过程包括对待测音频用同样方式提取特征,用训练 本发明中的核心技术是如何寻找到载体音频和载密音频的明显区分特征。因此,在 发明 内容陈述之前,首先对AMR编码原理及已有的嵌入算法原理进行介 一种基于代数码本线性预测(ACELP: 算法。固定码本搜索 好的model对特征进行判断,根据预测结果判定该音频是否为隐写音频。 绍。AMR编码器算法是 Algebraic Coded Exited Linear Prediction)的混合编码 是AMR编码过程中的关键环节,在脉冲轨道中选择最优的少数几个非 零脉冲位置来实现压缩编码。AMR中的固定码本结构是基于交错正负脉冲 Single-Pulse Permutation,ISPP)设计的,不同的编码速率模式具 AMR-NB12.2kbit/s模式下为例,该模式的脉冲 以20ms为一帧进行编码, 位置。 (Interleaved 有不同的脉冲分布。以 分布如表1所示。编码器将8kHz采样率信号 每帧分为4个5ms子帧,每个子帧有40个采样点,即40个脉冲 固定码本矢量在每个子帧中进行搜索,根据表1将40脉冲点分为5个轨道,在每 个轨 冲位置。 表1AMR-NB12.2kbit/s模式下固定码本矢量中非零脉冲分布 在AMR编码过程中,固定码本搜索对于每个脉冲位置的选择原则是保证合成语音 与原 始语音的加权均方误差最小。从理论上讲,如果使用全局搜索算法, 整个参考帧内最优,但在实际编码过程中为了保 算法代替全局搜索算法以提 道中选择2个非零脉冲位置进行编码,每个子帧共编码10个非零脉 则获得的码本应保持在 证编码算法的计算效率,往往使用快速搜索 高搜索速度,这就使得最终得到的码本通常是次优的而非最优。 而现有AMR隐藏算法则是基于该思路,改变固定码本的搜索策略,以其它次优码 本代 替搜索到的码本矢量实现秘密信息的嵌入。首先通过深度优先搜索树 然后限制每个轨道最后一个非零脉冲位置的可选 信息之间建立一种映射关系 构建一个目标码本矢量, 范围,使其与同轨道其它脉冲位置以及秘密 完成秘密信息的嵌入。 这类隐藏算法破坏了固定码本搜索的脉冲分布特性,使得同轨道中的非零脉冲位置 之间 具有较强的相关性。通过对大量载密和载体音频样本的实验发现,隐 写音频同一轨道中两个 脉冲位置相同的概率明显高于其原始音频(载体 所示,原始音频和隐写音频 道1中 音频)中脉冲位置相同的概率。如表2,表3 均采用AMR-NB12.2kbit/s模式编码,表格中每个浮点值代表轨 两个脉冲位置在整段音频信号中同时出现的概率PCP值,横轴表示轨道1中第一 个非 零脉冲可选位置,纵轴表示轨道1中第二个非零脉冲可选位置。从表 中的PCP分布明显比原始音频均匀,尤其表现 显小于隐写音频,其数值基 的 中可以看出,隐写音频 在对角线上。原始音频的PCP分布对角线值明 本为0.008左右,而隐写音频的则为0.015左右,与周围其他位置 PCP值接近。 表2是本发明实施例AMR-NB12.2kbit/s编码模式下,载体音频轨道1的PCP统计 值 colspec> 表3是本发明实施例AMR-NB12.2kbit/s编码模式下,隐写音频轨道1的PCP统计 值 colspec> 而原始音频和隐写音频重压缩校准之后的PCP分布都与重压缩之前的原始音频 PCP分布 一致,说明AMR编码过程中固定码本搜索有抑制2个脉冲选 本专利中AMR隐写分析方法的思想来源。 利用分类器算法实现 择同一个位置的倾向。这也是 因此,本发明提出基于脉冲位置相同概率特征SPP, 隐写检测。 本发明的隐写分析方法采用模式识别的分类机制,分为训练和预测两大部分。训练 部分 如附图1中S2步骤所示,包括对训练音频构成的训练样本集(即所有 和stego)进行特征提取,之后对所选定特征用分 采用现有技术实现;预测过 行同样 音频样本,包括cover 类器进行训练,得到分类model,分类器可 程如如附图1中S3步骤所示所示,对待测样本(即待测音频)进 的特征提取,用分类model对特征进行预测检验得到最终结果。实施例的训练和预 测 都用到了特征提取,特征提取部分如附图2所示,对于待测音频进行 相同概率特征SPP。预测部分用分类model对提 还是非隐写音频。下面分别 解码后计算其脉冲位置 取的特征做分类判决,结果指示是隐写音频 对隐写分析的训练部分和预测部分的做详细描述。 如图1所示,一种针对AMR音频文件的隐写分析方法,其特征在于,包括如下步 骤: 步骤1.构建一个AMR自适应多速率语音编码音频样本库;随机选择一部分音频样 本作为 步骤2.训练过程,包括如下步骤: 步骤2.1,输入训练样本集,对包括隐写音频和非隐写音频的训练样本集中所有的 训练 步骤2.2,通过分类器对训练样本集中的所有训练音频的同轨道脉冲位置相同概率 特征 步骤3.预测过程,包括以下步骤: 步骤3.1,解码待测样本集音频的帧,计算待测音频的同轨道脉冲位置相同概率特 征SPP; 步骤3.2,根据训练得到的分类model对待测音频的同轨道脉冲位置相同概率特征 SPP 其中,同轨道脉冲位置相同概率特征SPP,具体实现方式如下: 1.对于一个AMR压缩音频的比特流,假定其包含的子帧总数为Nf, 每个子帧中脉冲数量 为Np,每个子帧中轨道数量为 进行预测,判断是否为隐写音频; 矢量SPP进行训练得到分类model; 音频进行解码,然后计算同轨道脉冲位置相同概率特征矢量SPP; 训练样本集,其余音频样本为待测样本集; Nt,每个轨道中脉冲的数量为Np_t,解码AMR音频的每 个子 2.若整段音频信号中同一轨道两个非零脉冲位置同时出现的概率PCP,则轨道t的 帧,提取其非零脉冲位置参数; PCP 矩阵计算如下: mo> mrow> n> w> o>, o> h> 其中,0≤t≤Nt-1;i,j为轨道t中可选脉冲位置,1≤i,j≤Np; f为子帧序号,1≤f≤Nf; ia为轨道t中第一个非 零脉冲的位置,ib为轨道t中第二个非零脉冲的位置,P是一个子帧中 3.若整段音频信号中同一轨道两个非零脉冲位置相同概率为SPP,则轨道t中每个 脉冲 位置i(1≤i≤Np)的SPP值计算如下式,即该轨道中第一、 同一轨道两个非零脉冲位置同时出现的概率 第二脉冲位置相同的概率: SPPt(i)=PCPt(i,i) 因此待测音频的特征SPP= {SPPt(i)|1≤i≤Np,i≠First_Pos(t),0≤t≤Nt-1},其中 采用本发明提出的针对AMR的隐写分析方法,对已有的两种基于轨道脉冲位置调 First_Pos(t)为轨道t的第一个可选脉冲位置。 制的 AMR隐写算法,在不同嵌入率、不同编码模式、不同嵌入参数情况 实验评估; 下的检测性能进行了综合 实验过程如下: 实验设置 音频测试序列:实验采用了两种类型的音频数据库。所有音频样本片段的时长约为 30s 左右,包括数字语音和不同语言的音乐,如英语、汉语、日语、韩语, 民谣等。 类型涵盖爵士、摇滚、 音频数据库DB1:包括网络下载和手机录制AMR压缩音频。其中有1570段来自 网上下载, 2000段来源于不同手机录制的AMR音频片段,编码模式 样本。 12.2kbit/s,共计3570段AMR音频 音频数据库DB2:自制音频。来自于网络公开WAV数据库和以及自己通过 cooledit录制 的PCM音频,共计2303段,8kHz采样,16bit量化无压缩, 公开的floating-point AMR编码器源码进 10.2kbit/s,共得到编码 单声道,对每段WAV采用3GPP 行编码,编码速率模式分别选择12.2kbit/s和 AMR样本4606段。 隐藏算法:实验针对现有文献中所提出的基于固定码本搜索的脉冲位置隐写方法, 实现 了Geiser B和Miao两种方法。以伪随机生成序列的方式在DB2音频 过程中嵌入秘密信息。最终得到隐写样本集如下:库2303段WAV音频编码 隐写样本库Stego1:采用Geiser B方法,在AMR12.2kbit/s编码模式下,对DB2样 本 库的样本分别生成相对嵌入率为20%、30%、40%、60%、80%和 100%的样本,共计2303*6=13818 段隐写AMR样本。 隐写样本库Stego2:采用Miao隐藏算法,设置控制每个子帧嵌入比特数因子η分 别为 1,2或4。对于每个η值,在12.2kbit/s编码模式下,对DB2样本库的 入率为20%、30%、40%、60%、80%和100% DB2样本库的样本分别生 样本分别生成相对嵌 的载密音频样本;在10.2kbit/s编码模式下,对 成相对嵌入率为25%、37.5%、50%、75%和100%的载密音频样本,所 训练和分类:实验分两部分进行,AMR编码速率分别为12.2kbit/s和10.2kbit/s。 对待测cover(载体)和stego(隐写)音频按帧解码,提取出脉冲位置参数,计算每个 音频样本的SPP特征值。对12.2kbit/s编码模式的样本,提出的特征维数为 择50%的cover音频、30%嵌入率为20%以及20%嵌 中η=1,4)进行训练,其余样本用 为36维,用 得样本总数为2303*3*6+2303*3*5=75999段。 35维,随机选 入率为40%的stego音频(Miao嵌入方法 来预测。对10.2kbit/s编码模式的样本,提取的特征维数 50%的cover音频、35%嵌入率为25%以及15%嵌入率为50%的stego音频进行训 实验结果 AMR编码模式为12.2kbit/s和10.2kbit/s的实验结果分别如表4和表5所示。实验 数 据的性能指标用TPR,TNR表示,其中,TPR表示将stego样本正确 TNR表示将cover样本正确判断为载体样本的概 练,剩余样本用来测试。实验选择LIBSVM分类器,核函数采用RBF。 判断为隐写样本的概率, 率,MBC为该嵌入模式情况下的最大嵌入容量, 单位为kbps,相对嵌入率为实际嵌入bit数占文件可嵌入最大bit数的比例。 表4和表5中 嵌入率为0%的情况为载体音频,其中网络AMR是指对数据 检测的TNR值;η为Miao方法中库DB1的3570段AMR样本的隐写 嵌入比特数控制参数。由于Geiser B方法只能实现对AMR-NB 12.2kbit/s模式的嵌入,因此在表5中仅有Miao方法在取不同η值的检测结 果。 表4编码模式为12.2kbit/s的隐写分析检测结果 表5编码模式为10.2kbit/s的隐写分析检测结果 以上实验结果表明,在AMR-NB12.2kbit/s编码模式下,本发明提出的方法针对通 过3GPP AMR编码器制作的载体音频的TNR为94.14%;而针对网络 该方法对载体音频有很好的分类判 Geiser B隐藏 AMR音频的TNR为83.8%,因此, 定性能。针对不同嵌入率的载密音频的检测,本发明对 算法的检测性能优于针对Miao的检测性能,对Geiser B隐藏算法,在相对嵌 入率为30%及以上时TPR可以达到86%;对Miao隐藏算法,在相对嵌入 可以达到87%,因此具备良好的隐写分类性能。 法针对cover音频的TPR为 高于 率为40%及以上时TPR 在AMR-NB10.2kbit/s编码模式下,本文方 90.18%;对隐写音频,本发明在相对嵌入率为37.5%及以上时,TPR 83%,因此具备良好的AMR隐写分类性能。
版权声明:本文标题:一种针对AMR音频文件的隐写分析方法 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dongtai/1713864673a375273.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论