admin管理员组文章数量:1561890
本快速入门介绍如何使用适用于 Linux 的语音设备 SDK 来生成支持语音的产品,或将其用作对话听录设备。 目前,只有 Azure Kinect DK 受支持。
该应用程序是使用语音 SDK 程序包和 Eclipse Java IDE (v4) 在 64 位 Linux(Ubuntu 16.04、Ubuntu 18.04、Debian 9、RHEL 7/8、CentOS 7/8)上构建的。 它在 64 位 Java 8 运行时环境 (JRE) 中运行。
本指南需要一个包含语音服务资源的 Azure 认知服务帐户。
示例应用程序的源代码随附在语音设备 SDK 中, 也可在 GitHub 上获取。
先决条件
本快速入门需要:
操作系统:64 位 Linux(Ubuntu 16.04、Ubuntu 18.04、Debian 9、RHEL 7/8、CentOS 7/8)
语音服务的 Azure 订阅密钥。 免费获得一个。
下载用于 Java 的语音设备 SDK 的最新版本,并将 .zip 提取到工作目录。
备注
本快速入门假设应用已解压缩到 /home/wcaltest/JRE-Sample-Release
确保在启动 Eclipse 之前安装这些依赖项。
在 Ubuntu 上:
sudo apt-get update
sudo apt-get install libssl1.0.0 libasound2
在 Debian 9 上:
sudo apt-get update
sudo apt-get install libssl1.0.2 libasound2
在 RHEL/CentOS 上:
sudo yum update
sudo yum install alsa-lib openssl
备注
在 RHEL/CentOS 7 上,按照如何为语音 SDK 配置 RHEL/CentOS 7 上的说明进行操作。
在 RHEL/CentOS 8 上,按照如何配置 OpenSSL for Linux 上的说明进行操作。
对话听录目前在“centralus”和“eastasia”区域中仅提供“en-US”和“zh-CN”。 必须在这些区域中的一个区域中具有语音密钥,才能使用对话听录。
如果计划使用意向,则将需要语音理解服务 (LUIS) 订阅。 若要了解有关 LUIS 和意向识别的详细信息,请参阅使用 LUIS、C# 识别语音意向。 示例 LUIS 模型适用于此应用。
创建和配置项目
启动 Eclipse。
在 Eclipse IDE Launcher 的“工作区”字段中,输入新工作区目录的名称 。 然后选择“启动”。
片刻之后,Eclipse IDE 的主窗口将会显示。 如果出现了欢迎屏幕,请将其关闭。
从 Eclipse 菜单栏上,依次选择“文件” > “新建” > “Java 项目”以新建一个项目。 如果不可用,请依次选择“项目”和“Java 项目”。
此时将启动“新建 Java 项目”向导。 浏览 示例项目所在的位置。 选择“完成” 。
在“包资源管理器”中,右键单击你的项目。 从上下文菜单中选择“配置” > “转换为 Maven 项目”。 选择“完成”。
打开 pom.xml 文件并对其进行编辑。
在文件末尾,在结束标记 之前,创建 repositories 和 dependencies 元素(如此处所示),并确保 version 与当前版本匹配:
maven-cognitiveservices-speech
Microsoft Cognitive Services Speech Maven Repository
https://csspeechstorage.blob.core.windows/maven/
com.microsoft.cognitiveservices.speech
client-sdk
1.15.0
在“包资源管理器”中,右键单击你的项目。 选择“属性”,然后依次选择“运行/调试设置” > “新建...” > Java 应用程序。
此时将显示“编辑配置”窗口。 在“名称”字段中,输入 Main,并对“Main 类”使用“搜索” ,以查找和选择 com.microsoft.cognitiveservices.speech.samples.FunctionsList。
从 Linux-arm 或 Linux-x64 中将目标体系结构的音频二进制文件复制到 Java 项目位置,例如 /home/wcaltest/JRE-Sample-Release
同样从“编辑配置”窗口中,选择“环境”页和“新建”。 此时将显示“新环境变量”窗口。 在“名称”字段中输入 LD_LIBRARY_PATH,并在“值”字段中输入包含 *.so 文件的文件夹,例如 /home/wcaltest/JRE-Sample-Release
将 kws.table 和 participants.properties 复制到项目文件夹 target/classes
配置示例应用程序
将语音订阅密钥添加到源代码。 如果想要尝试意向识别,还需要添加语言理解服务订阅密钥和应用程序 ID。
对于语音和 LUIS,你的信息将进入 FunctionsList.java:
// Subscription
private static String SpeechSubscriptionKey = "";
private static String SpeechRegion = "westus"; // You can change this if your speech region is different.
private static String LuisSubscriptionKey = "";
private static String LuisRegion = "westus2"; // you can change this, if you want to test the intent, and your LUIS region is different.
private static String LuisAppId = "";
如果使用的是对话听录,Cts.java 中还需要语音密钥和区域信息:
private static final String CTSKey = "";
private static final String CTSRegion="";// Region may be "centralus" or "eastasia"
默认关键字为“Computer”。 还可以尝试所提供的其他关键字之一,例如“Machine”或“Assistant”。 这些备用关键字的资源文件位于语音设备 SDK 的 keyword 文件夹中。 例如,/home/wcaltest/JRE-Sample-Release/keyword/Computer 包含用于关键字“Computer”的文件。
要使用新的关键字,请更新 FunctionsList.java 中的下面一行,并将关键字复制到应用。 例如,要使用关键字包 machine.zip 中的关键字“Machine”,请执行以下操作:
将 kws.table 文件从 zip 包复制到项目文件夹“target/classes”中。
使用关键字名称更新 FunctionsList.java:
private static final String Keyword = "Machine";
从 Eclipse 运行示例应用程序
从 Eclipse 菜单栏中,依次选择“运行” > “运行”
语音设备 SDK 示例应用程序将会启动,并显示以下选项:
试用新的“对话听录”演示。 通过“会话” > “启动”来启动听录。 默认情况下,每个人都是来宾。 但是,如果你拥有参与者的语音签名,则这些签名可以放入项目文件夹 target/classes 的 participants.properties 中。 若要生成语音签名,请查看听录对话 (SDK)。
创建并运行独立应用程序
在“包资源管理器”中,右键单击你的项目。 选择“导出”。
此时将显示“导出”窗口。 展开“Java”,选择“可运行的 JAR 文件”,然后选择“下一步”。
此时将显示“可运行的 JAR 文件导出”窗口。 为应用程序选择“导出目标”,然后选择“完成”。
请将 kws.table 和 participants.properties 放入上面选择的目标文件夹中,因为该应用程序需要这些文件。
将 LD_LIBRARY_LIB 设置为包含 *.so 文件的文件夹
export LD_LIBRARY_PATH=/home/wcaltest/JRE-Sample-Release
运行独立的应用程序
java -jar SpeechDemo.jar
版权声明:本文标题:手机当电脑麦克风 linux,快速入门:在 Windows、Linux 或 Android 上运行语音设备 SDK - 语音服务 - Azure Cognitive Services | Micros... 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/xitong/1727469498a1116050.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论