百度语音识别——在线识别|电子爱好者

admin管理员组
文章数量:1654379

在线识别语音技术

1. 开发背景
2. 开发过程
- 2.1 下载SDK
- 2.2 熟悉源码
- - 2.2.1 初始化
  - 2.2.2 开始识别/唤醒
  - 2.2.3 回调事件
  - 2.2.4. 控制识别/唤醒
  - 2.2.5. 事件管理器退出
- 2.3 SDK接入
- - 2.3.1 导入core 模块
  - 2.3.2 配置app依赖core
  - 2.3.3 测试及解决运行问题
  - 2.3.4 集成方法对比
- 2.4 基于SDK集成开发
- - 2.4.1 配置AndroidManifest.xml 文件
  - - a.设置权限
    - b.设置APP_ID, APP_KEY, SECRET_KEY及注意点
  - 2.4.2 Main.java
3. 开发结果
- 3.1.效果图
- 3.2.简单展望

1. 开发背景

在AI席卷全球时，围绕语音交互的产品之争正愈演愈烈，苹果siri、亚马逊echo这些产品风靡全球的同时，国内外科技巨头、创业团队也在暗流涌动，各种智能音箱以及语音解决方案层出不穷。这种顺势发展的方式，造就了语音交互已经成为人工智能领域最成熟也是落地最快的技术。尤其是深度学习的起势，让语音识别、语音合成以及自然语言处理的发展速度提升到了一个新的高度。
发展到现在各个公司平台语音识别技术都相当成熟，Android 平台现在主要是基于谷歌、科大讯飞、百度等较为主流的SDK进行开发。谷歌的话，在国内的环境是需要修改，且访问速度慢；科大讯飞的话，虽然也是国内的，但只有一段时间的试用期；最终选择百度，既方便使用，又是白嫖产品。

2. 开发过程

2.1 下载SDK

1）百度搜索 “语音识别技术” 点击第一个超链接进入主页面

2）主页面菜单栏下开发与教学=>SDK下载

3）找到 “语音识别Android SDK” 进行下载，后续也可进入 “使用说明”，查看源码的使用方式。

2.2 熟悉源码

源代码提供的是一个在SDK的基础上封装了输入和输出格式的DEMO，主要由app、core、uiasr、uidialog这四个Module组成。其中core为核心且带有SDK的库，其下的 “ActivityMiniRecog类” (精简版识别，带有SDK唤醒运行的最少代码，仅仅展示如何调用)中的在线识别部分也是此次研究的重点。

参见DEMO中的ActivityMiniRecog类
SDK调用过程(在线识别)如下：

2.2.1 初始化

1.初始化EventManager类
SDK中，通过工厂创建语音识别的事件管理器。注意识别事件管理器只能维持一个，请勿同时使用多个实例。即创建一个新的识别事件管理器后，之前的那个置为null，并不再使用。

	EventManager asr = EventManagerFactory.create(this, "asr"); 
	// this是Activity或其它Context类

2.自定义输出事件类
SDK中，需要实现EventListener的输出事件回调接口。该类需要处理SDK在识别过程中的回调事件。可以参考DEMO中对SDK的调用封装。

	EventListener yourListener = new EventListener() {
   
		@Override
		public void onEvent(String name, String params, byte [] data, int offset, int length) {
   
			if(name.equals(SpeechConstant.CALLBACK_EVENT_ASR_READY)){
   
				// 引擎就绪，可以说话，一般在收到此事件后通过UI通知用户可以说话了
			}
			if(name.equals(SpeechConstant.CALLBACK_EVENT_ASR_PARTIAL)){
   
				// 一句话的临时结果，最终结果及语义结果
			}
				// ... 支持的输出事件和事件支持的事件参数见“输入和输出参数”一节
		}
	};

3.注册自己的输出事件类

	asr.registerListener(yourListener);

2.2.2 开始识别/唤醒

1.设置识别/唤醒输入参数
SDK中，您需要根据文档或者demo确定您的输入参数。DEMO中有UI界面简化选择和测试过程。demo中，在点击“开始录音”按钮后，您可以在界面或者日志中看见ASR_START事件的json格式的参数。
2.发送start开始事件

	asr.send(SpeechConstant.ASR_START, json, null, 0, 0);

2.2.3 回调事件

1.开始回调事件
回调事件在您实现的EventListener中获取。OnEvent方法中， name是输出事件名，params该事件的参数，(data,offset, length)三者一起组成额外数据。如回调的音频数据，从data[offset]开始至data[offset + length] 结束，长度为length。

	public void onEvent(String name, String params, byte [] data, int offset, int length);

2.2.4. 控制识别/唤醒

1.控制停止识别/唤醒，可以向SDK发送停止事件

	asr.send(SpeechConstant.ASR_STOP, null, null, 0, 0); 
	//发送停止录音事件，提前结束录音等待识别结果

2.取消本次识别，可以向SDK发送取消事件

	asr.send(SpeechConstant.ASR_CANCEL null<

本文标签：在线语音识别

版权声明：本文标题：百度语音识别——在线识别内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729660736a1209641.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

百度语音识别——在线识别

在线识别语音技术

1. 开发背景

2. 开发过程

2.1 下载SDK

2.2 熟悉源码

2.2.1 初始化

2.2.2 开始识别/唤醒

2.2.3 回调事件

2.2.4. 控制识别/唤醒

更多相关文章

python如何判断QQ是否在线？

web项目使用OpenOffice实现前端在线预览office文档(超详细)

使用docker在线离线部署onlyoffice，在线预览编辑demo

pageOffice实现word在线编辑保存功能

【第三方对接】使用 永中Office 实现在线 Office 整合到 Spring 项目

【个人作品案例展示】“在线”租房系统

【个人作品参考案例】“在线”租房系统

学生党超实用的在线gpu加速服务器ATUODL，与pycharm连接使用教程。

【深度学习】使用kaggle提供的免费GPU在线训练模型

在线客服代码：在线QQ客服、在线旺旺客服

Python编程入门教程(以在线评测平台为载体)

vue2.0借用vue-pdf实现在线预览pdf文件

react react-pdf实现在线pdf加载 翻页加载、下拉滚动加载

react react-pdf实现在线pdf加载（翻页加载、下拉滚动加载）

vue2中封装弹框组件pdf在线预览+下载（oss云链接）

《2台虚拟机》docker单节点在线安装rancher2.5.2最新稳定版

2021星空实施在线认证初级班（1）

[百度解析工具]利用IDM工具在线提速下载

百度语音识别+图灵机器人+python实现智能对话（小爱机器人）

百度语音识别——在线识别

发表评论

推荐文章

【librosa】librosa.feature.mfcc介绍

怎么把酷狗音乐转换成MP3格式

超级好用的安卓手机助手

微信小程序源码获取（附工具的下载）

Navicat-mysql 中文破解版下载及基础使用教程

热门文章

Spring Cloud Netflix

计算机桌面右下角的图标不见了,图标,详细教您怎么解决右下角图标不见了的问题...

CAD2012软件安装资料及教程

Linux的基本使用

python 3.10.6安装包程序下载，不再下载失败3.5、3.6、3.7、3.8、3.9、3.10一文讲懂python和pycharm的安装。

pdf如何转化成word文档呢?

ppd文件下载 linux,Linux系统R230,R270,R330,L380打印机驱动下载爱普生喷墨打印机PPD文件...

安装操作系统的方法?

达人评测i7 1360p和i5 1240p差距 酷睿i71360p和i51240p选哪个

i7 10750h 和i5 10300h 对比哪个好

最新文章

【Docker】win10上修改docker的镜像文件存储位置（九）

win10虚拟机VMware安装homeassistant镜像

DIY win10 ESD镜像并安装

win10无法装载iso文件_win 10如何装载和弹出ISO映像文件

Windows 72008 R2 SP1 RTM 全部版本官方下载

将文件从主系统win10传送到VMware虚拟机上的win11

使用win10自带的虚拟光驱挂载ISO镜像文件，并安装QTP

使用win10自带虚拟光驱打开ISO镜像文件

【效率工具合集】Win10镜像迅雷快速安装

win10 镜像文件资源

Win10镜像安装net3.5

Win10 镜像安装到新固态硬盘两法

windows10下载ios文件以及虚拟机vmware安装（学习记录）

vmware安装win10镜像出现boot Manager

windows7下TexLive2016的安装和配置

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【第三方对接】使用永中Office 实现在线 Office 整合到 Spring 项目

react react-pdf实现在线pdf加载翻页加载、下拉滚动加载

达人评测i7 1360p和i5 1240p差距酷睿i71360p和i51240p选哪个

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载