使用语音识别、ChatGpt、文心一言进行交互|电子爱好者

admin管理员组
文章数量:1530823

通过调用百度语音识别的api接口进行语音识别，然后将识别到内容发送给chatgpt以及文心一言的api接口进行交互，实现该功能。

要实现这个功能，首先需要申请百度语音识别的API接口，并进行相关配置。然后编写代码，利用百度语音识别的API接口对语音进行识别，获取识别到的文本内容。

接着，需要调用ChatGPT和文心一言的API接口，将识别到的文本内容发送给这两个接口进行交互。这样就可以实现将语音内容转换成文本后，再通过人工智能模型进行进一步处理和生成相关回复。

在具体实现过程中，需要注意处理API接口的请求和响应，并确保数据的安全性和准确性。

总的来说，通过调用百度语音识别的API接口进行语音识别，并与ChatGPT和文心一言的API接口进行交互，可以实现一个智能化的语音交互系统，提供更加便捷和个性化的服务体验。

百度语音识别api的调用

1、首先去百度AI开放平台-全球领先的人工智能服务平台申请语音识别的API_ID以及API_SECRET。

2、根据官方的API调用示例，调取语音识别的接口。

import requests
import json
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode

API_KEY = "自己的" 
SECRET_KEY = "自己的"

#获取百度语音token
def get_access_token():
    """
    使用 AK,SK 生成鉴权签名{Access Token)
    :return: access_token,或是None(如果错误)
    """
    url = "https://aip.baidubce/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))
#百度语音转文字
def speech_to_text_baidu():
        
    ASR_URL = 'http://vop.baidu/server_api'
    #要想转换的音频（要想实时转换的话，可以在这行代码前面加入语音采集的代码，保存到/home/lxj/chat_robot/audio.wav，自己的地址）
    with open('/home/lxj/chat_robot/audio.wav', 'rb') as f:
        audio_data = f.read()

    params = {'cuid': "eAfx7sGxI092FxvCuADljopHxiJjruPX", 'token': get_access_token(), 'dev_pid': 1537}#1537代表普通话识别，其他的看官网文档
    params_query = urlencode(params)

    headers ={
        'Content-Type': 'audio/' + 'wav' + '; rate=' + str(16000),
    }
    # 请求转换结果
    req = Request(ASR_URL + "?" + params_query, audio_data, headers)

    try:
        f = urlopen(req)
        result_str = f.read()

        result_str =json.loads(result_str)
        result_str = result_str.get("result")[0]

        return result_str
    except  URLError as err:
        print('asr http response http code : ' + str(err.code))
        result_str = err.read()
        print(result_str)

ChatGpt的API调用（需要魔法）

1、首先到OpenAI官网注册账号登陆，申请api_key，一个月5美元的免费额度（够用）。

2、安装openai的pyhon库

pip install openai

3、实现OpenAI的调用（很简单）

import openai

client = OpenAI(api_key="  ")# 请替换为您的API密钥

#Chatgpt
def gpt(data):

    try:
        # 向GPT发送请求，并获取回复
        chat_completion = client.chatpletions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "user", "content": data}  # 使用接收到的用户消息
            ]
        )
    except Exception as e:
        print(f"发生错误: {e}")
        return ""

    # 获取GPT的回复
    gpt_reply = chat_completion.choices[0].message.content
    print("GPT Reply: %s", gpt_reply)

文心一言API的调用

1、到百度AI开放平台-全球领先的人工智能服务平台去申请千帆大模型的API_ID以及API_SECRET。

2、根据官方的API调用示例，调取语音识别的接口。

import requests
import json
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode

wx_API_KEY = "自己的"
wx_SECRET_KEY = "自己的"

#获取文心一言token
def get_access_token_wx():
    """
    使用 AK,SK 生成鉴权签名(Access Token)
    :return: access_token,或是None(如果错误)
    """
    url = "https://aip.baidubce/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": wx_API_KEY, "client_secret": wx_SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

def wxyy(data):
        
    url = "https://aip.baidubce/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=" + get_access_token_wx()
    
    payload = json.dumps({  
        "messages":[{
            "role": "user",
            "content": data
        }]

    })
    headers = {
        'Content-Type': 'application/json'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    response_json = response.json()  # 将响应文本解析为JSON对象
    result = response_json.get("result")  # 提取result字段的值
    print("WX Reply: %s", result)

语音识别、ChatGpt、文心一言结合

加入了键盘监控事件，当按下键盘enter键时，开始交互。


from pyaudio import PyAudio,paInt16  #导入音频处理库Pyaudio，没有的话要pip 安装
from openai import OpenAI
import threading
import requests
import json
from urllib.request import urlopen
from urllib.request import Request
from urllib.error import URLError
from urllib.parse import urlencode
from pynput.keyboard import Listener, Key
import speech_recognition as sr

# 创建一个锁对象
lock = threading.Lock()

######################百度语音############3############
API_KEY = "" 
SECRET_KEY = ""
####################文心一言############################
wx_API_KEY = ""
wx_SECRET_KEY = ""
#######################################################

#Chatgpt
def gpt(data):
    try:
        # 向GPT发送请求，并获取回复
        chat_completion = client.chatpletions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "user", "content": data}  # 使用接收到的用户消息
            ]
        )
    except Exception as e:
        print(f"发生错误: {e}")
        return ""

    # 获取GPT的回复
    gpt_reply = chat_completion.choices[0].message.content
    print("GPT Reply: %s", gpt_reply)

#获取百度语音token
def get_access_token():
    """
    使用 AK,SK 生成鉴权签名{Access Token)
    :return: access_token,或是None(如果错误)
    """
    url = "https://aip.baidubce/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

#获取文心一言token
def get_access_token_wx():
    """
    使用 AK,SK 生成鉴权签名(Access Token)
    :return: access_token,或是None(如果错误)
    """
    url = "https://aip.baidubce/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": wx_API_KEY, "client_secret": wx_SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

def wx(data):
        
    url = "https://aip.baidubce/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=" + get_access_token_wx()
    
    payload = json.dumps({  
        "messages":[{
            "role": "user",
            "content": data
        }]

    })
    headers = {
        'Content-Type': 'application/json'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    response_json = response.json()  # 将响应文本解析为JSON对象
    result = response_json.get("result")  # 提取result字段的值
    print("WX Reply: %s", result)
 
#百度语音转文字
def speech_to_text_baidu():
        
    ASR_URL = 'http://vop.baidu/server_api'

     # 初始化识别器
    recognizer = sr.Recognizer()

     # 初始化识别器
    recognizer = sr.Recognizer()
    with sr.Microphone() as source:
        print("请说话...")
        audio = recognizer.listen(source)
    audio_data = audio.get_wav_data(convert_rate=16000, convert_width=2)
    
    params = {'cuid': "eAfx7sGxI092FxvCuADljopHxiJjruPX", 'token': get_access_token(), 'dev_pid': 1537}
    params_query = urlencode(params)

    headers ={
        'Content-Type': 'audio/' + 'wav' + '; rate=' + str(16000),
    }
    # 请求转换结果
    req = Request(ASR_URL + "?" + params_query, audio_data, headers)

    try:
        f = urlopen(req)
        result_str = f.read()

        result_str =json.loads(result_str)
        result_str = result_str.get("result")[0]

        return result_str
    except  URLError as err:
        print('asr http response http code : ' + str(err.code))
        result_str = err.read()
        print(result_str)

# 当有键盘被按下时执行的函数
def on_press(key):
    if key == Key.enter:

        global user_input
        user_input = speech_to_text_baidu()
        print("语音转换结果："+user_input)
       
        #gpt(user_input)
        wx(user_input)
    if key == Key.esc:       
        print("按了ESC键")
        exit(0)
       
if __name__ == '__main__':
        # 初始化OpenAI客户端
        client = OpenAI(
            api_key="自己的",  # 请替换为您的API密钥
        )
        print("chat启动！")
        # 创建键盘监听器
        while  True:
            with Listener(on_press=on_press) as listener:
                listener.join()

本文标签：一言语音识别 chatGPT

版权声明：本文标题：使用语音识别、ChatGpt、文心一言进行交互内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1725038189a1003612.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

用ChatGPT通过WebSocket开发一个交互性的五子棋微信小程序（二）

1天前

文章目录 1 前言1.1 实现的原理1.2 如何与微信小程序联系 2 五子棋项目2.1 申请OpenAI的API2.2 调用API代码2.3 界面代码 3 同步五子棋到前端小程序3.1 WebSocket长连接3.2 获取实时下棋 4 讨论

用ChatGPT写代码学物联网，10分钟模拟设备并查看数据

1天前

ChatGPT是时下火热的AI自然语言引擎，啥都知道啥都会，今天咱们就使用ChatGPT来写一段python代码，模拟一个温湿度传感器，持续的给服务器发数据，并在物联网管理软件ThingsPanel上显示数据。我们的工作分为两个部分，首

关于ChatGPT等AIGC技术对人类社会的影响

1天前

梗概横空出世的ChatGPT作为新一代人工智能技术，开启了通用人工智能时代，标志着人工智能具有广泛的学习能力并在大多数领域达到或超过普通人类的水平，其社会影响将巨大而深远

ChatGPT transformer 5篇经典论文以及代码和解读

1天前

一次性读懂ChatGPT的技术演进路线，根据李沐老师推荐的5篇经典论文，整理了论文原文、论文解读、Github代码实现。 2017Transformer继MLP、CNN、RNN后的第四大类架构2

ChatGpt只能看,但无法发送消息的解决办法

1天前

这几天发现chatgpt没法发送消息了,我以为是网络问题,又过了几天还是不能发,我以为是梯子的问题,可给我急坏了,于是我用无痕模式发现可以访问额. 但是无痕模式毕竟不是长久之计,于是找到了一个方法 1.首先把电脑缓存全清除了第一种方法

【起草】1-2 讨论 ChatGPT 在自然语言处理领域的重要性和应用价值

1天前

【小结：ChatGPT 在自然语言处理领域的八种典型应用】注明：为提升文章质量，请喜欢这篇文章的读者在评论区留言，把需要进一步说明的内容告知 Chat

如何加入bing的chatgpt内测计划

1天前

网址： https:www.bing 登录： 点击‘了解详细信息’： 点击‘加入等待列表’： 加入名单： 如何加快审

15个借助AI,ChatGPT自动写代码工具

1天前

整理了15个借助AI和ChatGPT辅助我们自动写代码的工具，整理到 15个借助AI,ChatGPT自动写代码工具https:www.webhub123#homedetail?projectHashid19

类ChatGPT产品Claude上线Slack平台，一手实测体验在此

1天前

文章目录 Claude-in-Slack自我介绍成语接龙数学能力代码能力其他总结 Claude-in-Slack Claude是Anthropic推出的类ChatGPT对话机器人。Anthropic是一家由前OpenAI团队成员创立的人工

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

1天前

悟纤之歌这是利用AI为自己制作的一首歌，如果你也感兴趣，可以花点时间阅读下本篇文章。导读随着新一代AI音乐创作工具Suno V3、Stable audio2.0、天工SkyMusic

免费的 ChatGPT 网站

1天前

网站名称 wAIchatOS 网址：https: chat18.aichatos8.xyz 网站是免费的，直接在输入框输入就可以了。

chatGPT与逆向的相遇，快速解决sslpinning抓包问题

1天前

项目场景： 这是一款金融类型的安卓app，有着root检测，与sslpinning校验，并且带有壳。下载的unpinning脚本根本行不通&#

基于python，chatgpt，gpt-sovits进行b站直播ai语音自动回复弹幕部署

1天前

最终达成效果亚托莉自动回复机器人实现思路我们将实现步骤分为三个部分，输入-处理-输出。首先，输入便是b站直播间用户发送的弹幕，那我们就需要借助requests库对

【国内免费chatGPT】

1天前

网址：https:ai.52bsuser-center?inVitecodeBEVUDUXMUR 亲测好用

小狐狸ChatGPT付费AI创作系统v2.0.4 PC+H5+小程序前端

1天前

小狐狸GPT付费体验系统是一款基于ThinkPHP框架开发的AI问答小程序，是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。功能特点充值系统 - 每次提问扣一条，当赠送的免费次

免费ChatGPT合集——亲测免费

1天前

1、YesChat 无需登录网址：YesChat-ChatGPT4V Dalle3 Claude 3 All in One Freehttps:www.yeschat.ai 2. 讯飞星火

前期准备: 使用“类chatGPT”工具完成课程设计的规划

1天前

目录前提要求： 1. 什么是ChatGPT？它能帮我们做什么？ 2. 有哪些类ChatGPT工具？ 3. 你觉得想要用好用"类Cha

【舒一笑赠书活动-第1期】-ChatGPT原理与架构

1天前

🎉**本文专栏：启航书海活动（首次启动，免费送书给每一位热心读者）** ✨**本文简述：每本书都是一扇窗&

ChatGPT与马斯克在 “ 遥感 ” 中的初探索

1天前

有人说：一个人从1岁活到80岁很平凡，但如果从80岁倒着活，那么一半以上的人都可能不凡。生活没有捷径，我们踩过的坑都成为了生活的经验，这些经验越早知道，你要走的弯路就会越少。1前言文章开始前，我们先看几个对话：（1）遥感

吐血整理 ChatGPT 3.54.0 新手使用手册~ 【2024.09.06 亲测好用】

1天前

以前我也是通过官网使用，但是经常被封号，就非常不方便，后来有朋友推荐国内工具，用了一阵之后，发现：稳定方便&

电子爱好者 - 最新技术资讯及电子产品介绍！

使用语音识别、ChatGpt、文心一言进行交互

百度语音识别api的调用

ChatGpt的API调用（需要魔法）

文心一言API的调用

语音识别、ChatGpt、文心一言结合

更多相关文章

用ChatGPT通过WebSocket开发一个交互性的五子棋微信小程序（二）

用ChatGPT写代码学物联网，10分钟模拟设备并查看数据

关于ChatGPT等AIGC技术对人类社会的影响

ChatGPT transformer 5篇经典论文以及代码和解读

ChatGpt只能看,但无法发送消息的解决办法

【起草】1-2 讨论 ChatGPT 在自然语言处理领域的重要性和应用价值

如何加入bing的chatgpt内测计划

15个借助AI,ChatGPT自动写代码工具

类ChatGPT产品Claude上线Slack平台，一手实测体验在此

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

免费的 ChatGPT 网站

chatGPT与逆向的相遇，快速解决sslpinning抓包问题

基于python，chatgpt，gpt-sovits进行b站直播ai语音自动回复弹幕部署

【国内免费chatGPT】

小狐狸ChatGPT付费AI创作系统v2.0.4 PC+H5+小程序前端

免费ChatGPT合集——亲测免费

前期准备: 使用“类chatGPT”工具完成课程设计的规划

【舒一笑赠书活动-第1期】-ChatGPT原理与架构

ChatGPT与马斯克 在 “ 遥感 ” 中的初探索

吐血整理 ChatGPT 3.54.0 新手使用手册~ 【2024.09.06 亲测好用】

发表评论

推荐文章

dotnet nuget push nuget 包出现 error: Response status code does not indicate success: 405 (Not Allowed)

不用再找了，ChatGPT 3.54.0新手使用手册~ （论文润色、降重、扩写指令）【亲测好用】

安装和配置Edge，Firefox和chrome浏览器驱动

Win10自动修复失败，无法正常启动

准备windows请勿关闭计算机要多久,windows10系统提示正在准备windows请勿关闭计算机怎么办...

热门文章

2023年12月10日最新Python源码：使用ChatGPT(NLP)批量处理文件，自动提取关键信息并生成总结!

U盘格式转化-exFAT转NTFS

U盘未分配空间合并——U盘分区扩展卷为灰色的

2021-01-27

开启Google Chrome浏览器加速模式

2017 Pycharm激活码

（1）搭建工程开发环境

服务器千兆网卡显示百兆,windows10系统查看网卡是千兆还是百兆的方法

Windows 10 系统全新安装 - 以GPT 分区形式

Jetson nano安装Google拼音输入法

最新文章

海思平台上USB WIFI的移植与局域网无线调试和视频流预览(1)

wifi一到晚上服务器无响应,一到晚上九点，网络就开始卡了？主要原因是这三点！...

【1】Kali破解家用WI-FI密码 - WEP加密

WIFI原理，WIFI6各代介绍 2020-11-23

wifi卡慢延迟高_如何解决WiFi又慢又卡

手机控制电脑,在WIFI局域网下(关机,重启,遥控)

Kindle wifi 连接不上的问题

linux wifi关闭5g,双频路由器怎么关掉5G频段无线信号？

STM32智能门禁连接阿里云（指纹开锁、密码开锁、刷卡开锁、手机开锁）

如何0元搭建一个共享收费Wifi？

android系统wifi控制风扇,（开源）ESP8266改装小风扇，app远程控制+天猫精灵控制...

802.11协议：wifi

ESP8266 wifi钓鱼

无线WIFI安全渗透与防御

WPA2-PSK无线密码破解

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

ChatGPT与马斯克在 “ 遥感 ” 中的初探索

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载