admin管理员组

文章数量:1533913

2024年2月15日发(作者:)

2022年 10月第4

第5期0沈阳师范大学学报(自然科学版)JournalohenanormalUniversitNaturalScienceEdition)fSygNy(Vol.40No.5Oct.2022()文章编号:167358622基于语音识别的智能对话系统的研究与实现张浩华,李哓慧,王爱利,刘凡杨,柴

欣,程骞阁()沈阳师范大学物理科学与技术学院,沈阳 110034摘

要:随着时代的发展变化,人工智能在整个互联网中逐渐普及。作为人工智能中比较成熟的技术,语音识别被广泛应用在各行各业中。在信息技术服务业和教育行业中,语音识别系统的制作为人们的知识获取提供了便利的学习方式。通过研究语音识别技术的发展现状、语音识别算法的基本原理,对比3种典型的算法,选择出最优算法,进而实现了语音识别算法在硬件上的应:用。通过将m搭配I利用语音识别模块识别关键词语,不断检icrobit作为主板,Obit2.0扩展板,测听到的语音词汇,对听到的语音块作出反应,同时MP播放问题3模块和腔体小喇叭协同配合,对应的答案,从而设计完成了具有语音识别及对话功能的智能系统。:;语音识别模块;智能对话关

词:语音识别算法;microbit:1/.16735862.2022.05.012j中图分类号:TP273

文献标志码:AResearchandimlementationofintellientdialouesstempggybasedonseechreconitionpgZHANGHaohua,LIXiaohui,WANGAili,LIUFananIXin,yg,CHACHENGQianeg:W,aAbstractiththedevelomentandchaneoftheerartificialintellienceisgraduallpggy(,,)ColleeofPhsicalScienceandTechnoloShenanormalUniversitShenan10034,ChinagygyygNyyg1,ticSeechReconitionasoneofthematuretechnolopppggy,llintheinformationgyyappjpytechnoloerviceandeducationwork,themanufactureofseechreconitionsstemprovidesgyspgy,paerestudasicsituationgwyfpgpyb:inconsidermicrobitasmainboardpppg,aboutAutomaticSeechReconitiondomesticandoverseasandfundamentalprincileofseechpgpp,nhreeclassicalseechreconitionmodulereconizemaintermsanddetectppgg,g,sconnectinheMP3moduleandthecaviteakereakerwillplaheansweraboutthegtysppyt,dialoue

g:v:;v;iKeordsoicereconitionalorithm;microbitoicereconitionmodulentellientggggyw0

言古往今来,人类社会不断变化,科学技术也在不断更新。现代科学技术的发展,推动着人类经济、社收稿日期:20211023);辽宁省教育厅科学研究经费项目()。基金项目:中国高等教育学会创新创业教育重点研究项目(2020CYD03LJKZ1006,作者简介:张浩华(男,辽宁沈阳人,沈阳师范大学副教授,博士。1977-)Copyright©博看网. All Rights Reserved.

第5期

张浩华,等:基于语音识别的智能对话系统的研究与实现447

。在这种时代背景下,会生活等的方方面面机器人系统应运而生。人们对机器人系统本质的了解逐渐加深,促使它开始不断地渗入到人类的生产生活中去。据此,人们发展创造了各种各样不同形态的智能系统。智能语音系统的出现促进了学生的知识学习。通过语音识别,智能系统会根据关键词回答出正确答案,也可以根据关键词播放对应的文章、歌曲。它可以应用在教育培训机构或者学校的教学上,也可致力于科普知识的宣传。智能机器人系统的应用与研发在近年来形成了非常火爆的趋势,人机交互]1。的真正实现离不开语音识别技术的快速发展[1

语音识别基本理论1.1

国内外现状世界各国开始研究简单的英文数字识别内容;语音识别理论及算法大规20世纪50年代,70年代,模涌现;到8研究者们采用统计分析的方法研究连续语音识别,研究重点转移到了词汇量较大的0年代,中国开始进行计算机语音识别的研究。9清华大学和中科院自动化所等单位在汉语听写机原理0年代,1.2

基本原理3]4],。按照语音识别[原理是接收语音信号,并将语音信号转化为文字,或者对其进行查询的操作[识别对象的不同,它可以分为孤立词、连接词和连续语音识别等;根据针对的发音人,能够划分为特定人]5。非特定人语音识别系统更适合生活的实际需求。语音识别包括以下语音识别和非特定人语音识别[]6。几部分:提取与处理语音特征、对语音进行降噪、建立语言模型、声学模型训练[2]。样机的研究方面取得了重要成果。2深度学习的出现极大促进了语音识别技术的发展[1世纪,语音上。在我国,20世纪50年代末有研究者采用电子管电路对英文中的元音字母进行识别。70年代,1.3

主流算法在语音识别技术常用的方法中,随机模型法包括几种主流算法,一般主要有动态时间规整方法、矢]7]8。量量化方法、隐马尔可夫模型方法、人工神经网络[方法和支持向量机等语音识别方法[]9。此方法计算起来比较复杂,动态时间规整算法可以比较二者之间相似的范围[但方法比较简单,识别语音较为准确。它不容易将各种知识应用到算法中去。矢量量化是对信号进行压缩,所需要训练的数据较少,所用存储空间也较小。它被用在词汇较少的情况中。但是,这种算法在很多性能上都没有优于基于参数模型的隐马尔可夫模型的方法。10]。此种算法域。V尤其在隐马尔可夫模型中[iterbi算法被用于寻找观测时间序列的隐含状态序列,隐马尔可夫模型是一种使用概率的统计模型,广泛应用于信号处理、语音识别、行为识别等应用领可以被用于词汇量较多的情况和系统中,缺点是需要占用较大存储空间,但识别率却高出许多。2

语音识别算法计算量也比同样功能的算法更小。它将全局最优Viterbi算法可以帮助找到问题解决的最优路径,的方法展开到局部最优,很好地解决了全局的问题。它在保证最优解的情况下,序列中的基于非线性的时间对准和针对词语边界的检测问题也得到很好地解决。由此,该算法成为语音识别中常被采用的算法。…,输入:模型λ=(和观测O=(A,B,Π)ooo1,2,T)***,,…,)输出:最优路径I*=(ii1i2T)初始化1)递推,…,对t 2=2,3,T),…,δiaxδaboi=1,2,N=mt(1<=t1(i]i(t)j)-j<=N[j)终止 3()a,…,rmaxδai=1,2,Ng1<=t1(i]j)-j<=N[jti=φ)P*=maxδT(i1<=j<=N),…,δiboi=1,2,N=Π1(ii(1))…,ii=1,2,N=0,φ1(*)]iarmaxδig1<=T(j<=N[t=)最优路径回溯,…,对t 4=T-1,T-2,1Copyright©博看网. All Rights Reserved.

448沈阳师范大学学报(自然科学版)

第40卷

求得最优路径()it=t1it1++φ*****,,…,)I*=(ii1i2T3

语音识别算法的实现3.1

系统总体设计:本系统主要采用m与语音识别模块相连接,采用语icrobit主控板和IObit2.0扩展板为主架构,]11。同时搭配MP音识别芯片L通过语音识别获取控制指令[实现总体搭D3320,3模块及腔体小喇叭,建,整体系统框图如图1所示。本系统通过添加词组,对用户的言语进行识别并比对,识别完成后,相应地播放对应的音频。本设计有较强的灵活性。图1

系统框图Fi.1 Sstemblockdiaramgyg3.2

系统硬件设计:3.2.1 microbit主板:也可外接电池盒供电,实物如图2所示。本系统选取m控制其他模microUSB供电接口,icrobit主板,]13。块的功能,它具有较为全面的功能和易于编程的特点[12]:。开发板集成三合是一台微型计算机[microbit是基于微软公司的开源平台编程经验工具包,一传感器芯片,同时兼具加速度计、磁力计和陀螺仪的功能,可以与手机A它还自带PP进行蓝牙通信;Fi.2 Phsicaldiaramgyg图2

实物图3.2.2 IObit2.0扩展板::IObit是一款支持microbit的IO口引出扩展板。它可以引出microbit上的所有输入/输出资源,同时自带蜂鸣器开关,通过跳线帽的自由切换,实现对P0引脚的连接与释放。此扩展板既支持3V电压,也支持5V电压,可连接多种传感器。扩展板增加了较为丰富的传感器功能模块,满足设计的多种需求。3.2.3

语音识别模块语音识别模块选取了适合的语音识别算法应用于芯片,它可以通过语音唤醒来制作智能系统的部分。通过两线式串行总线识别语句、获取结果,发送和接收数据,实现人类和机器的交互。当断电时,它14]。针对非特定人的语音识别技可以完成识别语音和声音控制的功能[LD3320芯片的语音识别模块,[5]术A是以关键词语列表为基础的一种匹配识别算法。它的本质在于声音特征提取完毕后,寻找匹SR1可以保存其中的数据,模块可以添加高达5每条语句的汉字不能超过10条的识别语句,0个。嵌入配度最高的语句。输入到语音芯片的声音要与关键词进行对比逐个打分。同时,它有以下3种识别Copyright©博看网. All Rights Reserved.

第5期

张浩华,等:基于语音识别的智能对话系统的研究与实现449

模式。循环检测模式:系统会不断检测听到的语音并识别。口令检测模式:识别到口令时,蜂鸣器响一声,之后开始识别,每唤醒一次识别一次。]16。模块原理如图3所示。发出对应的词汇语音。计时结束后,需要重新触发按键继续识别[按钮检测模式:外界语音传输到系统主控中心,语音识别芯片会开始计时,在固定的时间段内,外界图3

模块原理图Fi.3 Moduleschematicdiaramgg3.2.4 MP3-TF-16P模块直接采用微处理器MP3模块提供串口,对不同格式的音频解码。根据编码方式及编码过程,会从存储卡中自动寻找到对应格式的音频文件,此时,MP3模块对调出的文件解17]。此模块在上层码,播放对应的语音文件[可以完成音乐播放的指令和音乐播放的形式选择,省去下层烦琐的操作,可靠性得以提升。图4 MP3模块方案图Fi.4 Moduleschemediaramgg它支持多种不同的采样率,让音乐选取更加多样。同时,它可以通过不同的方式控制音乐播放,有简单的输入输出、按键开关控制和串口控制模式等。文件系统中最多包含1每个文件夹有200个文件夹,55,首曲目。片上系统(方案,开发难度和成本较低,因而被选用,方案如图4所示。sstemonchiSoC)yp同时,选用了将内存、利用a硬解USB等接口和驱动电路整合在一起的集成电路MCU,DSP进行解码,码的方式使得整个系统更加稳定可靠。3.3

系统软件设计3.3.1

语音识别模块主程序设计语音模块要进行初始化设置,添加词语列表,同时设置变量作为识别结果。接通电源时,微控制器向语音识别芯片写18]。本入系列词语,然后控制芯片循环识别听到的声音信号[系统通过检测人们发出的声音,判断识别词语是否匹配,并播3.3.2 MP3-TF-16P模块主程序设计实现问答功MP3-TF-16P模块与语音识别模块配合使用,能。MP3-TF-16P模块的部分代码如下:(){ rfunction(_R() value=lt() umbervalue){ if(value==1() ckin1,1pygpyyyp

}() 2000p})放对应文件夹的音频。语音识别流程如图5所示。3.4

系统性能测试语音识别算法有很多种,本文将算法传输到芯片实现语图5

语音识别流程图Fi.5 SeechreconitionflowchartgpgCopyright©博看网. All Rights Reserved.

450沈阳师范大学学报(自然科学版)

第40卷

4

。本系统应用语音识别算法,:音识别获得了较大的完成度结合m扩展板,通过对语音识icrobit主板、别模块和MP很好地实现了离线语音识别的功能。3-TF-16P模块进行设计编码,本文分别从语音识别理论的简要概述、语音识别算法的对比以及其在硬件系统上的实现几个方面介绍了基于语音识别的智能对话系统,通过语音识别算法嵌入芯片,结合使用语音识别模块和MP3-实现了问答功能和人机交互,为算法在硬件的实现提供了一定参考。语音识别算法在智TF-16P模块,能音箱、智能家居等人工智能领域被广泛应用,对于不同的智能系统都有很好的借鉴作用。本次设计的智能对话系统,具有较强的实用性和推广性,可以在此基础上继续改进。参考文献:[]():胡钊龙,李栅栅.语音识别技术在智能语音机器人中的应用[1]J.电子技术与软件工程,2021137273.[]():鱼昆,张绍阳,侯佳正,等.语音识别及端到端技术现状及展望[2]J.计算机系统应用,2021,3031423.[],():ssPersCommun2021,[3]KAURG,SRIVASTAVAM,econitionusinnhancedfeatureswithdeeeliefnetworkforpggepb[]():于俊婷,刘伍颖,易绵竹,等.国内语音识别研究综述[4]J.计算机光盘软件与应用,2014,17107678.[]():胡新月.语音识别技术在软件工程中的应用[5]J.电子技术与软件工程,2.[],():肖安帅,樊国华,崔泽坤,等.语音识别相关技术研究[理论版)6]J.信息与电脑(2020,3216138140.[],():vComutSciAl2020,[7]IQBALM,RAZASA,ABIDM,cialneuralnetworkbasedemotionclassificationandreconitionfromg[]():王敏妲.语音识别技术的研究与发展[8]J.微型机与应用,2009,282312,6.3538+64.[]:王素宁,朱俊杰,李志勇,等.基于D9]TW算法的电力调度语音识别研究和应用[J.电力与能源,2021,42(1)[]]():朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[10J.测量与控制,2020,285175179.[]]():张洪源,杨佩.基于语音控制的智能分类垃圾桶的设计[11J.电脑知识与技术,2021,1723148149.[]:]():张帆.基于m12icrobit主控板的智能小车的硬件设计与实现[J.电子制作,2019193840.155156.

[]:]:米晶爽,张铁成,尹晓娇.基于m13icrobit开发板的可编程动漫衍生形象机器人研究[J.工业设计,2020(4)[]]():陈俊涛,许健才.面向服务机器人的简易人机语音交互系统设计[14J.科学技术创新,2.671680.

[]],2:enativeseechreconitionusinorhemes[vComutSciAl021,12(3)pggmpppp[]]():高翔.基于L16D3320的语音智能加热杯系统设计[J.软件,2020,4112129133.8788.

[]]:王敏坤,贾海天,施连敏.基于n17RF4L01和MP3模块的智能导游系统的实现[J.工业控制计算机,2012,25(3)[]]():葛炎风.基于语音控制的L18ED照明系统的研发[J.机电技术,ght©博看网. All Rights Reserved.

本文标签: 语音识别系统算法