admin管理员组

文章数量:1531705

2024年1月6日发(作者:)

机器人小I的使用方法

本程序是用微软的speech sdk 与vc++编写的,主要是用语音控制算机,实现与计算机的多通道交互,主要功能:

1. 报时

2. 听音乐

3. 上网

4. 看电影

一、配置:

1. 计算机中装有微软的speech sdk 5.1及中文包,Winamp,确然播放器。

2. 计算机中Winamp 、 explorer 按装在默认的路径中,MP3的默认的播放程序是Winamp,电影的播放程序是确然播放器

3. 电影存放的目录是:e:电影,每一部电影放在一个文件夹中

如:E:电影飞刀飞刀.rmvb.

4、打开Winamp 的控制快捷键,快捷键的设置:确然播放器与Winamp通用

播放/暂停:Ctrl+B

全屏:Ctrl+Home

上一首:Ctrl+Left

下一首:Ctrl+Right

退出:Ctrl+Q

二、使用:

1.为了达到最好的语音识别功能,先对计算机进行语音训练,再配置一个好的话筒。

2.在使用语音命令的时候,本程序每次的激活时间:10秒,也就是说在10秒内要是计算机没有识别出你的语音命令,它将会处于等待激活的状态,此时计算机能识别出你的语音命令,但对你的命令不再响应,同时它会提示你在使用命令之前说出他的名字,这时你要先说出他的名字“小I”,等它回答“老大,什么事?”的时候你再说出控制命令。

三、语音控制命令:

1. 报时

语音命令:“几点了” “现在什么时间”

2. 上网

语音命令:“我要上网”“我想上网” “上网”

计算机会打开你的explorer,

3.听音乐

语音命令:“我要听音乐”“听音乐”“我想听音乐”

Winamp打开之后:

语音命令:“播放” “下一首”“上一首”“上一首歌”“下一首歌”“换首音乐”

程序都会按你的要求去做,在你不想听音乐的时候通过“关闭音乐”退出winamp

3. 看电影

语音命令:“我要看电影”“我想看电影”“看电影”

在程序找出默认的文档中的电影之时,你按提示说出你想看的电影。按提示说出语音命令:“第X部”

说出语音命令“第X集”。

打开成功后,程序自动隐藏,提示电影打开成功。

看电影时语音命令:“全屏”

4. 对程序的语音命令:

“隐藏”“恢复”“自我介绍”“关闭”

总结:本程序的人机交互主要是多通道的人机交互的一个小的使用,对程序的控制一是鼠标的控制,一是语音的控制。在这两种通道中,以语音为主,主要是语音打开程序,这时的程序可能是两种控制,否则只能进行鼠标控制。

这只是我个人在语音控制方面的一个小的尝试,请老师多多指教,

5、存在的问题:

就是该语音识别为非特定人的识别,对环境的要求很高,误识别的的机会很大。

解决:1。采用激活的方式,激活的时间很短,只有10S,只有想控制程序的时候才激活(通过说出选定的词“名字”),在10s之中要是

没有识别语音的话就自动处于非激活状态,这期间只响应设定的选定的词。

2.在程序的开始,先对环境采集声音样本,对采集的声音先滤波。这个问题还没有解决。 :- )

本文标签: 语音程序命令控制电影