基于语音识别的智能对话系统的研究|电子爱好者

admin管理员组
文章数量:1533913

2024年2月15日发(作者：)

2022年 10月第4

卷

第5期0沈阳师范大学学报(自然科学版)JournalohenanormalUniversitNaturalScienceEdition)fSygNy(Vol.40No.5Oct.2022()文章编号:167358622基于语音识别的智能对话系统的研究与实现张浩华,李哓慧,王爱利,刘凡杨,柴

欣,程骞阁()沈阳师范大学物理科学与技术学院,沈阳 110034摘

要:随着时代的发展变化,人工智能在整个互联网中逐渐普及。作为人工智能中比较成熟的技术,语音识别被广泛应用在各行各业中。在信息技术服务业和教育行业中,语音识别系统的制作为人们的知识获取提供了便利的学习方式。通过研究语音识别技术的发展现状、语音识别算法的基本原理,对比3种典型的算法,选择出最优算法,进而实现了语音识别算法在硬件上的应:用。通过将m搭配I利用语音识别模块识别关键词语,不断检icrobit作为主板,Obit2.0扩展板,测听到的语音词汇,对听到的语音块作出反应,同时MP播放问题3模块和腔体小喇叭协同配合,对应的答案,从而设计完成了具有语音识别及对话功能的智能系统。:;语音识别模块;智能对话关

键

词:语音识别算法;microbit:1/.16735862.2022.05.012j中图分类号:TP273

文献标志码:AResearchandimlementationofintellientdialouesstempggybasedonseechreconitionpgZHANGHaohua,LIXiaohui,WANGAili,LIUFananIXin,yg,CHACHENGQianeg:W,aAbstractiththedevelomentandchaneoftheerartificialintellienceisgraduallpggy(,,)ColleeofPhsicalScienceandTechnoloShenanormalUniversitShenan10034,ChinagygyygNyyg1,ticSeechReconitionasoneofthematuretechnolopppggy,llintheinformationgyyappjpytechnoloerviceandeducationwork,themanufactureofseechreconitionsstemprovidesgyspgy,paerestudasicsituationgwyfpgpyb:inconsidermicrobitasmainboardpppg,aboutAutomaticSeechReconitiondomesticandoverseasandfundamentalprincileofseechpgpp,nhreeclassicalseechreconitionmodulereconizemaintermsanddetectppgg,g,sconnectinheMP3moduleandthecaviteakereakerwillplaheansweraboutthegtysppyt,dialoue

g:v:;v;iKeordsoicereconitionalorithm;microbitoicereconitionmodulentellientggggyw0

引

第5期

张浩华,等:基于语音识别的智能对话系统的研究与实现447

。在这种时代背景下,会生活等的方方面面机器人系统应运而生。人们对机器人系统本质的了解逐渐加深,促使它开始不断地渗入到人类的生产生活中去。据此,人们发展创造了各种各样不同形态的智能系统。智能语音系统的出现促进了学生的知识学习。通过语音识别,智能系统会根据关键词回答出正确答案,也可以根据关键词播放对应的文章、歌曲。它可以应用在教育培训机构或者学校的教学上,也可致力于科普知识的宣传。智能机器人系统的应用与研发在近年来形成了非常火爆的趋势,人机交互]1。的真正实现离不开语音识别技术的快速发展[1

语音识别基本理论1.1

国内外现状世界各国开始研究简单的英文数字识别内容;语音识别理论及算法大规20世纪50年代,70年代,模涌现;到8研究者们采用统计分析的方法研究连续语音识别,研究重点转移到了词汇量较大的0年代,中国开始进行计算机语音识别的研究。9清华大学和中科院自动化所等单位在汉语听写机原理0年代,1.2

基本原理3]4],。按照语音识别[原理是接收语音信号,并将语音信号转化为文字,或者对其进行查询的操作[识别对象的不同,它可以分为孤立词、连接词和连续语音识别等;根据针对的发音人,能够划分为特定人]5。非特定人语音识别系统更适合生活的实际需求。语音识别包括以下语音识别和非特定人语音识别[]6。几部分:提取与处理语音特征、对语音进行降噪、建立语言模型、声学模型训练[2]。样机的研究方面取得了重要成果。2深度学习的出现极大促进了语音识别技术的发展[1世纪,语音上。在我国,20世纪50年代末有研究者采用电子管电路对英文中的元音字母进行识别。70年代,1.3

主流算法在语音识别技术常用的方法中,随机模型法包括几种主流算法,一般主要有动态时间规整方法、矢]7]8。量量化方法、隐马尔可夫模型方法、人工神经网络[方法和支持向量机等语音识别方法[]9。此方法计算起来比较复杂,动态时间规整算法可以比较二者之间相似的范围[但方法比较简单,识别语音较为准确。它不容易将各种知识应用到算法中去。矢量量化是对信号进行压缩,所需要训练的数据较少,所用存储空间也较小。它被用在词汇较少的情况中。但是,这种算法在很多性能上都没有优于基于参数模型的隐马尔可夫模型的方法。10]。此种算法域。V尤其在隐马尔可夫模型中[iterbi算法被用于寻找观测时间序列的隐含状态序列,隐马尔可夫模型是一种使用概率的统计模型,广泛应用于信号处理、语音识别、行为识别等应用领可以被用于词汇量较多的情况和系统中,缺点是需要占用较大存储空间,但识别率却高出许多。2

语音识别算法计算量也比同样功能的算法更小。它将全局最优Viterbi算法可以帮助找到问题解决的最优路径,的方法展开到局部最优,很好地解决了全局的问题。它在保证最优解的情况下,序列中的基于非线性的时间对准和针对词语边界的检测问题也得到很好地解决。由此,该算法成为语音识别中常被采用的算法。…,输入:模型λ=(和观测O=(A,B,Π)ooo1,2,T)***,,…,)输出:最优路径I*=(ii1i2T)初始化1)递推,…,对t 2=2,3,T),…,δiaxδaboi=1,2,N=mt(1<=t1(i]i(t)j)-j<=N[j)终止 3()a,…,rmaxδai=1,2,Ng1<=t1(i]j)-j<=N[jti=φ)P*=maxδT(i1<=j<=N),…,δiboi=1,2,N=Π1(ii(1))…,ii=1,2,N=0,φ1(*)]iarmaxδig1<=T(j<=N[t=)最优路径回溯,…,对t 4=T-1,T-2,1Copyright©博看网. All Rights Reserved.

448沈阳师范大学学报(自然科学版)

第40卷

求得最优路径()it=t1it1++φ*****,,…,)I*=(ii1i2T3

语音识别算法的实现3.1

系统总体设计:本系统主要采用m与语音识别模块相连接,采用语icrobit主控板和IObit2.0扩展板为主架构,]11。同时搭配MP音识别芯片L通过语音识别获取控制指令[实现总体搭D3320,3模块及腔体小喇叭,建,整体系统框图如图1所示。本系统通过添加词组,对用户的言语进行识别并比对,识别完成后,相应地播放对应的音频。本设计有较强的灵活性。图1

系统框图Fi.1 Sstemblockdiaramgyg3.2

系统硬件设计:3.2.1 microbit主板:也可外接电池盒供电,实物如图2所示。本系统选取m控制其他模microUSB供电接口,icrobit主板,]13。块的功能,它具有较为全面的功能和易于编程的特点[12]:。开发板集成三合是一台微型计算机[microbit是基于微软公司的开源平台编程经验工具包,一传感器芯片,同时兼具加速度计、磁力计和陀螺仪的功能,可以与手机A它还自带PP进行蓝牙通信;Fi.2 Phsicaldiaramgyg图2

实物图3.2.2 IObit2.0扩展板::IObit是一款支持microbit的IO口引出扩展板。它可以引出microbit上的所有输入/输出资源,同时自带蜂鸣器开关,通过跳线帽的自由切换,实现对P0引脚的连接与释放。此扩展板既支持3V电压,也支持5V电压,可连接多种传感器。扩展板增加了较为丰富的传感器功能模块,满足设计的多种需求。3.2.3

语音识别模块语音识别模块选取了适合的语音识别算法应用于芯片,它可以通过语音唤醒来制作智能系统的部分。通过两线式串行总线识别语句、获取结果,发送和接收数据,实现人类和机器的交互。当断电时,它14]。针对非特定人的语音识别技可以完成识别语音和声音控制的功能[LD3320芯片的语音识别模块,[5]术A是以关键词语列表为基础的一种匹配识别算法。它的本质在于声音特征提取完毕后,寻找匹SR1可以保存其中的数据,模块可以添加高达5每条语句的汉字不能超过10条的识别语句,0个。嵌入配度最高的语句。输入到语音芯片的声音要与关键词进行对比逐个打分。同时,它有以下3种识别Copyright©博看网. All Rights Reserved.

第5期

张浩华,等:基于语音识别的智能对话系统的研究与实现449

模式。循环检测模式:系统会不断检测听到的语音并识别。口令检测模式:识别到口令时,蜂鸣器响一声,之后开始识别,每唤醒一次识别一次。]16。模块原理如图3所示。发出对应的词汇语音。计时结束后,需要重新触发按键继续识别[按钮检测模式:外界语音传输到系统主控中心,语音识别芯片会开始计时,在固定的时间段内,外界图3

模块原理图Fi.3 Moduleschematicdiaramgg3.2.4 MP3-TF-16P模块直接采用微处理器MP3模块提供串口,对不同格式的音频解码。根据编码方式及编码过程,会从存储卡中自动寻找到对应格式的音频文件,此时,MP3模块对调出的文件解17]。此模块在上层码,播放对应的语音文件[可以完成音乐播放的指令和音乐播放的形式选择,省去下层烦琐的操作,可靠性得以提升。图4 MP3模块方案图Fi.4 Moduleschemediaramgg它支持多种不同的采样率,让音乐选取更加多样。同时,它可以通过不同的方式控制音乐播放,有简单的输入输出、按键开关控制和串口控制模式等。文件系统中最多包含1每个文件夹有200个文件夹,55,首曲目。片上系统(方案,开发难度和成本较低,因而被选用,方案如图4所示。sstemonchiSoC)yp同时,选用了将内存、利用a硬解USB等接口和驱动电路整合在一起的集成电路MCU,DSP进行解码,码的方式使得整个系统更加稳定可靠。3.3

系统软件设计3.3.1

语音识别模块主程序设计语音模块要进行初始化设置,添加词语列表,同时设置变量作为识别结果。接通电源时,微控制器向语音识别芯片写18]。本入系列词语,然后控制芯片循环识别听到的声音信号[系统通过检测人们发出的声音,判断识别词语是否匹配,并播3.3.2 MP3-TF-16P模块主程序设计实现问答功MP3-TF-16P模块与语音识别模块配合使用,能。MP3-TF-16P模块的部分代码如下:(){ rfunction(_R() value=lt() umbervalue){ if(value==1() ckin1,1pygpyyyp

}() 2000p})放对应文件夹的音频。语音识别流程如图5所示。3.4

系统性能测试语音识别算法有很多种,本文将算法传输到芯片实现语图5

450沈阳师范大学学报(自然科学版)

第40卷

结

语

。本系统应用语音识别算法,:音识别获得了较大的完成度结合m扩展板,通过对语音识icrobit主板、别模块和MP很好地实现了离线语音识别的功能。3-TF-16P模块进行设计编码,本文分别从语音识别理论的简要概述、语音识别算法的对比以及其在硬件系统上的实现几个方面介绍了基于语音识别的智能对话系统,通过语音识别算法嵌入芯片,结合使用语音识别模块和MP3-实现了问答功能和人机交互,为算法在硬件的实现提供了一定参考。语音识别算法在智TF-16P模块,能音箱、智能家居等人工智能领域被广泛应用,对于不同的智能系统都有很好的借鉴作用。本次设计的智能对话系统,具有较强的实用性和推广性,可以在此基础上继续改进。参考文献:[]():胡钊龙,李栅栅.语音识别技术在智能语音机器人中的应用[1]J.电子技术与软件工程,2021137273.[]():鱼昆,张绍阳,侯佳正,等.语音识别及端到端技术现状及展望[2]J.计算机系统应用,2021,3031423.[],():ssPersCommun2021,[3]KAURG,SRIVASTAVAM,econitionusinnhancedfeatureswithdeeeliefnetworkforpggepb[]():于俊婷,刘伍颖,易绵竹,等.国内语音识别研究综述[4]J.计算机光盘软件与应用,2014,17107678.[]():胡新月.语音识别技术在软件工程中的应用[5]J.电子技术与软件工程,2.[],():肖安帅,樊国华,崔泽坤,等.语音识别相关技术研究[理论版)6]J.信息与电脑(2020,3216138140.[],():vComutSciAl2020,[7]IQBALM,RAZASA,ABIDM,cialneuralnetworkbasedemotionclassificationandreconitionfromg[]():王敏妲.语音识别技术的研究与发展[8]J.微型机与应用,2009,282312,6.3538+64.[]:王素宁,朱俊杰,李志勇,等.基于D9]TW算法的电力调度语音识别研究和应用[J.电力与能源,2021,42(1)[]]():朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[10J.测量与控制,2020,285175179.[]]():张洪源,杨佩.基于语音控制的智能分类垃圾桶的设计[11J.电脑知识与技术,2021,1723148149.[]:]():张帆.基于m12icrobit主控板的智能小车的硬件设计与实现[J.电子制作,2019193840.155156.

[]:]:米晶爽,张铁成,尹晓娇.基于m13icrobit开发板的可编程动漫衍生形象机器人研究[J.工业设计,2020(4)[]]():陈俊涛,许健才.面向服务机器人的简易人机语音交互系统设计[14J.科学技术创新,2.671680.

[]],2:enativeseechreconitionusinorhemes[vComutSciAl021,12(3)pggmpppp[]]():高翔.基于L16D3320的语音智能加热杯系统设计[J.软件,2020,4112129133.8788.

本文标签：语音识别系统算法

版权声明：本文标题：基于语音识别的智能对话系统的研究内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1707956480a211102.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

基于语音识别的智能对话系统的研究

更多相关文章

调用有道API实现语音翻译（汉译英）

计算机系统中设置保护系统还原,电脑设置的还原点，怎么使用之前设置的还原点进行恢复系统？...

电脑注册表误删恢复办法：系统文件和设置还原法

系统映像恢复计算机重启失败,电脑镜像还原失败后，重启出现missing operating system ，怎么办？...

Vmware虚拟机安装黑群辉提示系统可恢复，无限还原，解决办法。

怎么还原打开方式为计算机程序,W10电脑系统如何还原打开方式

电脑语音设置修复计算机,win10系统麦克风正确设置的恢复办法

Manjaro使用Timeshift进行系统迁移恢复

误删系统环境变量如何恢复？

联想服务器系统如何备份软件,联想笔记本如何使用系统自带备份还原功能进行备份与还原系统...

OEM系统及激活

【搜集+亲测】无法注册Flash Player的Activex控件最终解决方法（亲测，WIN7 64位系统）

苹果笔记本(Macbook)删除OS X系统 安装win7方法【MacBook Proair Mac OS X】

w10桌面不显示计算机了,电脑开机W10系统不显示桌面的解决方法

使用微软官方工具制作U盘系统重装盘

GB28181流媒体服务LiveGBS实现web浏览器直接与摄像头语音对讲的配置介绍

黑屏定屏那些事 - 系统机制，分析套路和实战（系统篇）

分布式系统的一致性问题（汇总）

分布式系统：最终一致性

分布式系统常用思想和技术

发表评论

推荐文章

AMD CPU无法安装Intel HAXM解决方法

Windows10系统安装软件后软件界面异常（变得很小或很大），界面显示不完全的解决方案

搜狗拼音输入法可以打出㎡(上标这种效果)

ubuntu14.04 安装搜狗拼音输入法及异常问题解决

mac如何检测移动硬盘 mac硬盘检测工具 Tuxera怎么用 Tuxera NTFS官网

热门文章

电脑引导,电脑常见开机引导错误的解决方法

Kali--MSF-永恒之蓝详解（复现、演示、远程、后门、加壳、修复）

视频播放器基础知识

家庭IOT监测之WIFI模块与ONENET平台

mount不是很熟悉转载文章了解下 转自http:forum.ubuntu.org.cnviewtopic.php?f=120&amp;t=257333...

linux 系统挂载移动硬盘，解决移动硬盘插入linux无反应问题

IBM X60一次安装iatkos v7 10.5.7成功并完美驱动，顺利升级10.5.8并与xp双系统

大学英语精读第三版（第六册）学习笔记（原文及全文翻译）——1A - Street Trees（街树）

Linux下Nagios的安装与配置

2020届春招面经之ThoughtWorks—软件开发工程师

最新文章

ThoughtWorks面试体验

ThoughtWorks咨询师们的博客

maven的pom 提示错误 Failure to transfer com.thoughtworks.xstream:xstream:jar:

探索ThoughtWorks Each：优雅的Scala Monadic编程库

JMeter导入jmx运行脚本时出现这样的错误jmeter.save.SaveService: Conversion error com.thoughtworks.xstream.converters...

Chain of Thought (CoT) 系列论文：大模型思维链，提升 LLM 的推理能力

Tree-of-Thought Puzzle Solver 学习资料汇总 - 一个使用LLM求解复杂推理任务的框架

Thoughtworks2019校园招聘来啦～～内推福利篇 了解一下

Maven错误问题解决 Failure to transfer com.thoughtworks.xstream:xstream:jar:1.3.1 from https:repo.maven

“Chain of Thought Reasoning“ 和 “Chain Prompts“ 是什么

Failure to transfer com.thoughtworks.xstream:xstream:jar:1.3.1 from http:repo1.maven.orgmaven2 wa

论文笔记(2)：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

Challenging BIG-Bench tasks and whether chain-of-thought can solve them阅读笔记

C# 生成二维码 两种方式ThoughtWorks.QRCodeZXing

深度思考（Deep Thought）：智能部署的未来之选

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

苹果笔记本(Macbook)删除OS X系统安装win7方法【MacBook Proair Mac OS X】

mount不是很熟悉转载文章了解下转自http:forum.ubuntu.org.cnviewtopic.php?f=120&t=257333...

Thoughtworks2019校园招聘来啦～～内推福利篇了解一下

C# 生成二维码两种方式ThoughtWorks.QRCodeZXing

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载