单片机学习：第一篇基于Python的树莓派语音助手|电子爱好者

admin管理员组
文章数量:1558888

title: 单片机学习：第一篇基于Python的树莓派语音助手
tags: 树莓派,python,语音助手,百度AIP

一、pyaudio录音

二、语音识别

三、与图灵机器人对话

四、语音合成

五、封装

树莓派功能十分强大，作为一个微型电脑，独特的阵脚设计使得树莓派开发的自定义程度非常高。本篇博客通过使用python语言，封装一个简单的语音助手程序。制作一个语音助手你需要如下物品：
```
1：一个树莓派（3代、4代皆可）
2：免驱的usb声卡（声卡需接在树莓派usb接口）
3：麦克风（接在声卡上）
4：有线音响（音响可连在声卡上，也可连在树莓派的3.5mm接口上）
（树莓派播放设备默认使用3.5mm接口，具体过程需要自定义播放设备）
```
如果要设置usb声卡输出，参考配置声卡教程：https://www.jianshu/p/f414b85b9e71，如果使用默认3.5mm接口输出可以忽略。
设计语音助手有如下过程：录音、语音识别、图灵机器人对话、语音合成，以下对各个过程进行介绍。

一、pyaudio录音

使用python语言进行录音，主要是将说话者声音输出成一段音频文件。对于python来说，这很容易。通过引用pyaudio库，可以进行录音、播放、生成wav文件等。
首先，我们在树莓派上需要下载pyaudio库： ```pip3 install pyaudio```
在pyaudio的官网http://people.csail.mit.edu/hubert/pyaudio/介绍上有对pyaudio的详细介绍，以官网示例：
创建一名为rec的python文件 ```sudo nano rec.py```

import RPi.GPIO as GPIO
import pyaudio
import wave
import os
import sys
def rec_fun():
    # 隐藏错误消息，因为会有一堆ALSA和JACK错误消息，但其实能正常录音
    # os.close(sys.stderr.fileno())
    BUTT = 26    # 开始录音的按钮：一边接GPIO26，一边接地
    GPIO.setmode(GPIO.BCM)
    # 设GPIO26脚为输入脚，电平拉高，也就是说26脚一旦读到低电平，说明按了按钮
    GPIO.setup(BUTT, GPIO.IN, pull_up_down = GPIO.PUD_UP)
    # wav文件是由若干个CHUNK组成的，CHUNK我们就理解成数据包或者数据片段。
    CHUNK = 512 
    FORMAT = pyaudio.paInt16  # pyaudio.paInt16表示我们使用量化位数 16位来进行录音
    RATE = 16000  # 采样率1.6k。
    WAVE_OUTPUT_FILENAME = "command.wav"
    print('请按住按钮开始录音...')
    GPIO.wait_for_edge(BUTT, GPIO.FALLING)
    # To use PyAudio, first instantiate PyAudio using pyaudio.PyAudio(), which sets up the portaudio system.
    p = pyaudio.PyAudio()
    stream = p.open(format = FORMAT,
                    channels = 1,    # cloud speecAPI只支持单声道
                    rate = RATE,
                    input = True,
                    frames_per_buffer = CHUNK)
    print("录音中...")
    frames = []
    # 按住按钮录音，放开时结束
    while GPIO.input(BUTT) == 0:
        data = stream.read(CHUNK)
        frames.append(data)
    print("录音完成，输出文件：" + WAVE_OUTPUT_FILENAME + '\n')
    stream.stop_stream()
    stream.close()
    p.terminate()
    wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
    wf.setnchannels(1)
    wf.setsampwidth(p.get_sample_size(FORMAT))    # Returns the size (in bytes) for the specified sample format.
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()
    return
# 可以直接运行rec.py进行测试，同时保证该文件import时不会自动运行
if __name__ == '__main__':
    rec_fun()

通过树莓派一点亮LED灯：https://www.luodeb.top/2020/06/21/raspberry/?from=timeline，我们对树莓派的阵脚已经有了大概了解。
按钮录音，是通过按钮控制阵脚高低电平。在上述代码里引用```import RPi.GPIO as GPIO```，选择26号输出脚和GND。
执行后按住按钮开始录音，会在rec.py同目录下生成command.wav文件。

二、语音识别

我选择了百度AIP平台，使用其语音识别技术。（当然也可使用Google、科大讯飞等平台）
1. 申请百度AIP账号与应用
在百度AI开发平台：https://ai.baidu/?track=cp:aipinzhuan|pf:pc|pp:AIpingtai|pu:title|ci:|kw:10005792注册账号，再在控制台创建一个新应用
2. python调用百度AIP
官网文档中有详细使用语音识别技术，包括python的示例。首先导入AipSpeech, 即百度AI语音识别的Python SDK客户端（```pip3 install baidu-aip```）。附上代码如下：

from aip import AipSpeech
import os

APP_ID = '你的IDID'
API_KEY = '你的KEYKEY'
SECRET_KEY = '你的secret_key'

# 新建一个 AipSpeech
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 读取文件
def get_file_content(filePath):   #filePath待读取文件名
    with open(filePath, 'rb') as fp:
        return fp.read()
# 语音识别
def stt(filename):
    # 识别本地文件
    result = client.asr(get_file_content(filename),
                        'wav',
                        16000,
                        {'dev_pid': 1537,}      # dev_pid 参数表示识别的语 言类型 1537表示普通话 
                        )
    print (result)
    return result['result']

# 解析返回值，打印语音识别的结果 
    if result['err_msg']=='success.': 
        word = result['result'][0].encode('utf-8')       # utf-8 编码 
        if word!='': 
            if word[len(word)-3:len(word)]=='，': 
                print (word[0:len(word)-3]) 
                with open('demo.txt','wb') as f: 
                    f.write(word[0:len(word)-3]) 
            else: 
                print (word.decode('utf-8').encode('gbk')) 
                with open('demo.txt','wb') as f: 
                    f.write(word) 
                f.close() 
        else: 
            print ("音频文件不存在或格式错误") 
    else: 
        print ("错误") 
# main 函数 识别本地录音文件 yahboom.wav 
if __name__ == '__main__':
    stt('command.wav')   # command.wav为待读取文件，请替换

三、与图灵机器人对话

使用图灵机器人基本原理就是使用urllib.request模块，向接口地址发送HTTP POST请求，请求中加入了聊天内容。（返回内容是一个字典）
首先我们需要申请一个机器人：官网入口：http://www.turingapi/
python代码参考：

import json
import urllib.request
def chat(question):
    api_url = "http://openapi.tuling123/openapi/api/v2"
    text_input = question
    req = {
        "perception":
        {
            "inputText":
            {
                "text": text_input
            },
            "selfInfo":
            {
                "location":
                {
                    "city": "xxx",
                    "province": "xxx",
                    "street": "xxx"
                }
            }
        },
        "userInfo": 
        {
            "apiKey": "xxxxxxxxxxxxx",    #你的key
            "userId": "123"         #唯一的标识，自选即可
        }
    }
    # 将字典格式的req转为utf8编码的字符串
    req = json.dumps(req).encode('utf8')
    print('\n' + '正在调用图灵机器人API...')

    http_post = urllib.request.Request(api_url, data=req, headers={'content-type': 'application/json'})
    response = urllib.request.urlopen(http_post)    
    print('得到回答，输出为字典格式：')

    response_str = response.read().decode('utf8')
    response_dic = json.loads(response_str)
    intent_code = response_dic['intent']['code'] 
    
    # 返回网页类的输出方式
    if(intent_code == 10023):
        results_url = response_dic['results'][0]['values']['url']
        results_text = response_dic['results'][1]['values']['text']
        with open("result.txt","w") as f:
            f.write(results_text)  # 自带文件关闭功能，不需要再写f.close()
        answer = {"code": intent_code, "text": results_text, "url":results_url}
        print(answer)
        return(answer)
    # 一般的输出方式
    else:
        results_text = response_dic['results'][0]['values']['text']
        answer = {"code": intent_code, "text": results_text}
        with open("result.txt","w") as f:
            f.write(results_text)  # 自带文件关闭功能，不需要再写f.close()
        print(answer)
        return(answer)

if __name__ == '__main__':
    with open("demo.txt", "r",encoding='UTF-8') as f:
        text  = f.read()  # 读取文件
    eg_question = text
    chat(eg_question)

四、语音合成

我同样选择了百度的语音合成（注意，AI平台新建应用后，语音合成技术需要自行领用。语音识别的key与合成的key不一样，使用请注意）。示例文档自行参考，提供参考代码：

#encoding:utf8
from aip import AipSpeech
import os

""" 你的 APPID AK SK """
APP_ID = 'xxxxx'
API_KEY = 'xxxxxxxxxxxxxxxx'
SECRET_KEY = 'chMdMAS0acD7sPS6FhP3a3iOijU7wMVl'
def speak(text_content):
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    texts = text_content
    result = client.synthesis(texts , options={'vol':5})

    print('\n' + "正在调用语音合成API...")

    if not isinstance(result,dict):
        with open('answer.mp3','wb') as f:
            f.write(result)
    else:print(result)

    print("播放音频中...")
    print("以下均为mplayer的输出内容\n")
    os.system("mplayer answer.mp3")
    return
if __name__ == '__main__':   
    with open("result.txt", "rb") as f: # 打开文件

         text  = f.read()  # 读取文件       
    eg_text_content = text
    speak(eg_text_content)

五、封装

至此，我们的录音、识别、对话、合成已经完成了，开始对这四个py文件进行封装。
在封装时，增加一个获取获取歌曲直链url1.py文件。
一个简单的if else 完成了图灵机器人对话到在线放歌的切换。
当然，读者还可以进一步完善，例如实现与图灵机器人的多次对话直到退出。

需要参考我的全部代码，可以去我的资源下载

本文标签：单片机第一篇语音助手 Python

版权声明：本文标题：单片机学习：第一篇基于Python的树莓派语音助手内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727405127a1113287.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

单片机学习：第一篇 基于Python的树莓派语音助手

一、pyaudio录音

二、语音识别

三、与图灵机器人对话

四、语音合成

五、封装

更多相关文章

猜测一下以前的pp助手里的越狱应用是怎么制作的

打开ssh通道是什么意思_PP助手里有一个“打开SSH通道”SHH是什么？能干什么？...

比达应用商店报告：BT3用户多 豌豆荚PP助手活跃高

安装插件iClean pro， 期间与 pp助手冲突

使用iTools、PP助手清理垃圾前后文件夹对照图

十四，iOS公共文件夹的使用，可以再pp助手中拷贝文件到指定app中

PP越狱助手官方最新版 v1.6.0 绿色版

3-野火PID调试助手程序移植

抽签助手

【AI Code】CodeGeex：你的免费AI编程助手——基于清华ChatGLM的130亿参数预训练大模型

STM32温湿度传感器读取温湿度数据并显示到PC端串口助手

STM32单片机+DS18B20测温传感器+OLED屏幕+蜂鸣器报警+温度数据发送到串口调试助手+源代码

关于stm32f103c8t6串口通信——想要分享的小白 （通过串口调试助手进行验证）

有手就行-菜鸟教程-虚拟试衣 | 电商的得力助手

推荐开源项目： LetsPPT - AI智能生成PPT助手

linux串口调试stm32,STM32F4串口通信串口调试助手接收不到

STM32单片机+MAX30102心率血氧传感器+OLED屏幕+心率血氧数据发送到串口调试助手+源代码

STM32f4日记9之LD3320语音识别(您的私人语音助手MICRO)

STM32F429使用HC-SR04输出距离到串口助手

W600+STM32 AT指令(W600TCP服务器——用手机TCP调试助手发信息给单片机控制LED亮灭)

发表评论

推荐文章

Ubuntu安装TIM（QQ）

安卓保活（华为，OPPO，vivo，小米）

Windows与Linux相互远程桌面连接

如何给阿里云Windows server 2022分配D盘

win10键盘全变成快捷键_六种方法截图：Win10截屏快捷键、截屏工具，任意形状、可编辑...

热门文章

与JDK1.88.0匹配的eclipse 4.6版本的安装包

As we all know, at present, domestic mobile phone

w7提示无法关闭计算机,电脑关不了机怎么办w7系统_win7电脑正常关机关不了解决方法-win7之家...

如何用快捷键关闭计算机,电脑如何快捷键关机

京瓷1800打印机扫描步骤_京瓷复印机扫描设置方法京瓷复印机扫描到电脑设置...

IPhone无法usb线共享网络给windows电脑的常规解决办法

Financial

使用windows自带远程桌面远程办公

win10|为什么使用careUeyes时截屏颜色泛黄？

江科协STM32教程——STM32 使用串口助手进行LED灯的点亮熄灭灭控制全代码过程（USART串口通信的简单应用）

最新文章

qq企业邮箱 pop3服务器是什么意思,腾讯QQ企业邮箱POP3SMTP设置

腾讯企业邮箱通过Python自动发送邮件

SAP Integration Suite通过腾讯企业邮箱发邮件

腾讯企业邮箱批量清理邮件

使用腾讯企业邮箱发送邮件的Python脚本，支持发送给多人

利用python 脚本实现腾讯企业邮箱附件的批量下载

【Alertmanager】腾讯企业邮箱配置

【办公软件】Win10自带的邮件客户端配置腾讯企业邮箱账号详解

【邮件服务】hutool发送腾讯企业邮箱案例

phpmail通过qq发邮箱失败_网站使用了cdn之后，腾讯企业邮箱无法通过phpmailer发送邮件。...

【Java遵循SMTP协议调用JavaMail API实现通过腾讯邮箱（QQ邮箱）发送邮件的功能】

发送邮件到腾讯企业邮箱

SpringBoot：用腾讯企业微信邮箱发送邮件

腾讯企业邮箱的邮局服务器设置,网易邮件客户端如何配置腾讯企业邮箱 并设置服务器邮件同步-♚付涛纪实阁♚...

python程序下载腾讯企业邮箱附件_python批量下载邮件附件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

单片机学习：第一篇基于Python的树莓派语音助手

比达应用商店报告：BT3用户多豌豆荚PP助手活跃高

安装插件iClean pro，期间与 pp助手冲突

关于stm32f103c8t6串口通信——想要分享的小白（通过串口调试助手进行验证）

腾讯企业邮箱的邮局服务器设置,网易邮件客户端如何配置腾讯企业邮箱并设置服务器邮件同步-♚付涛纪实阁♚...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载