几种TTS软件的安装|电子爱好者

admin管理员组
文章数量:1531723

2024年2月2日发(作者：)

IVONA的安装

此程序的安装默认语言为polskj，安装时选择ednglish。

按屏幕提示正常安装即可。

在安装时要注意安装路径，之后安装语音库时默认路径即可。

安装完毕后，系统会提示安装语音库，此时的安装是在线安装，语音库我们已经全部下载，

在此我们直接点击完成。

语音库的安装：

下载的语音库共有8种（以后还会陆续增加），分美式英语和英式英语。安装过程基本按默认提示即可，需要注意的是语音库的安装要跟主程序在同一目录下。

操作说明：

双击IVONA Render启动程序：

：此项可以直接调用网页或DOC文档，进行阅读。

：此项可以将阅读内容保存为mp3格式。

：这个按钮的作用跟上面的保存成mp3格式一样的功能。

可以选择不同的文件格式及声音采样质量。

：打开一个新窗口：

：音量控制钮

：语速控制钮

：播放控制按钮

：语音库，根据需要选择不同的声音。

中科大讯飞Interphonic.5.0语音合成系统的安装

能说会道XP

在软件功能介面，中文TTS语音组件一定要安装（默认选项），不要作修改

能说会道XP支持中音混读，同时也支持多家公司的语音库。

ScanSoft-MeiLing-ChineseMandarinVoice 汉语普通话女声的安装：

安装目录可以自行修改，建议选用默认。

能说会道XP的制作过程很简单的，这里按照大致步骤总结一下。

第1步，准备工作

首先是安装好喜欢的语音库，以便提高语音质量。

第1步，选择合适的音频格式和MP3编码质量

打开“设置”窗口，翻至“音频编码”页面

媒体格式可以选择MP3，表示此次会将文本内容转换为MP3输出，软件另外还支持WAV的波形格式，

音频质量中的音频格式选项是指采样率，位数，立体声或单声道等，一般选择22kHz 16 Bit

Mono即可，有些语音包在16kHz 16 Bit Mono时效果最好，可以试听一下根据需要选择合适的格式。

这里顺便介绍一下“朗读时总使用最优质量”选项的作用。当需要试听上述“音频格式”的具体效果时，要把此选项的打勾去掉，表示在朗读时也使用这里选定的音频格式。当选项打勾时，则“能说会道 XP”在平时朗读时会忽略这里的“音频格式”设置，而会使用语音包默认的最优质量。

MP3编码质量是设置进行MP3压缩时的采样比特率，采用可变的采样比特率能够在输出文件大小适中的前提下，获得更好的压缩质量。

第2步，设置是否生成LRC歌词文件

点击“歌词生成”页面

制作对应的歌词文件能够在播放MP3时，同时看到具体的朗读内容，简单的说就是有字幕了，这在进行语言学习等场合下是十分有用的。

如果希望同时生成字幕文件，那么就在“为MP3生成LRC歌词文件”选项前打勾即可

“能说会道 XP”默认会根据句子来生成歌词文件，这里可以设置“限制每行歌词的文字数量”，这样生成的每句歌词就不会特别长了。

另外，一般情况下，中文会占用2个英文字母的位置，可以选中“中文占用2个字符位置”，这样，当设置的文字数量是36时，实际生成的每句歌词要么包含有36个英文（和空格），

或者18个中文（和空格），当中文和英文混合时，会自动确定能够容纳的文字数。

第3步，开始转换

做好上面的设置后，就直接按“确定”按钮保存设置，然后在主窗口的“工具”菜单下选择“导出为媒体文件”菜单项，然后会弹出“保存为”的文件保存对话框，选择希望的保存位置即可开始转换了。

句子停顿设置是一个“能说会道 XP”非常古老的功能，早在2000年推出的第一个版本时就带有该功能，但该项设置带来的效果并非只是让文章在朗读时语音上有所停顿那么简单，因此有必要重新熟悉一下这个“古老的”功能，让我们一起来看吧。

首先来看看，进行这项设置以后，除了朗读时的停顿以外，其他方面还有什么变化，我们做个实验：

1，首先使用上图所示的默认设置，此时进行朗读时：

2，随后修改停顿符设置，选中逗号

3，再进行朗读时

很明显，指示的当前朗读内容也按照逗号进行分开了

那么有什么用呢，最简单的，使用“能说会道 XP”重复朗读功能时，所重复朗读的内容就是高亮指示的内容，因此，这样就变化了重复朗读的范围。

实例一：用“能说会道 XP”背单词

举一个实际的例子，譬如我们想要通过单词表来学习英语单词，希望对每个单词进行重复朗读来加深印象：

abandon

丢弃；放弃，抛弃

ability

能力；能耐，本领

abnormal

不正常的；变态的

aboard

在船(车)上；上船

我们希望能够按行来朗读这些内容，这样就可以先听到单词的读音，再听到单词的中文意思，很适合单词学习。那么“能说会道 XP”能够进行按行朗读吗，这时候“停顿符设置”就派上用场了，其实“按行朗读”就是在换行的时候进行停顿，其他都不停顿，这样一想就好办了，在“英文停顿符”页面选中“回车/换行符”，其他打勾统统去掉，也就是不停顿，如下图，另外

也记得把“中文停顿符”设置页面的所有打勾也去掉哦，这样中文解释中间就不会分开了

然后再朗读背单词的文件，就可以看到是根据单词来停顿了：

配合自动重复朗读功能，就可以反复听每个单词的读音了，很适合学单词、背单词哦

实例二：制作背单词的MP3和LRC文件

“停顿符设置”同样对生成的LRC歌词文件有效，你所看到的朗读分句方式也就是LRC歌词文件的分句方式，很直观方便吧。之前有用户反馈说“能说会道 XP”生成的LRC歌词每句都太长了，有没有什么办法解决，其实这种情况下就可以使用“句子停顿”设置，把“逗号”设置成停顿符后，就可以把句子分的更短了。

我们再来看一个实例，还是用上面的单词表来做例子，如果我们希望制作一个背单词的MP3，并且同时希望输出一个LRC的歌词，以便在手机上播放时也能看到单词本身，这样眼睛耳朵同时用，肯定事半功倍哦

我们用“能说会道 XP”的MP3输出功能后，果然发现LRC歌词文件也是按行来生成的了：

[ti]大学英语四级单词

[by]能说会道 XP 2.85

[00:00.00]abandon

[00:05.73]丢弃；放弃，抛弃

[00:08.44]ability

[00:09.28]能力；能耐，本领

[00:11.92]abnormal

[00:12.85]不正常的；变态的

[00:15.22]aboard

[00:16.00]在船(车)上；上船

[00:19.18]

今天收到一个用户的来信，希望制作一段男女声的对话，用男女声依次朗读，作为英语听力材料。对于“能说会道 XP”而言，中英文是可以采用两个朗读者来朗读的，如果同样是英文时，就不会切换，因此直接得到男女生的英文对话看上去是不可能的。但是，我们还有另外一个武器，那就是“分句输出”功能，通过“分句输出”可以灵活的解决这个问题。

具体怎么做呢，先说说大致的想法，“分句输出”能够将每个句子转换成一个MP3文件，那么如果第一次用男声来读得到所有的句子（例如得到的文件为：对话_句3、对话_句3、对话_句3），第二次用女生来读又得到一遍所有的句子（对话_句3、对话_句3、对话_句3），这样如果我们想要男女生对话，其实就是挑出男声的“对话_句3”，挑出女声的“对话_句3”，再挑出男声的“对话_句3”，以此类推，这样就算再复杂的对话内容，总也可以通过这种方法完美的组合成一个对话。当然最后挑的过程需要人来参与。

具体制作步骤：

1，打开设置界面，在“输出方式”页面将“输出方式”选择为“分句输出”

2，在“英文语音属性”页面选择一个英文男声朗读角色作为“英文朗读者”

3，在“音频编码”页面选择“媒体格式”为MP3，并按动最下方的“确定”

4，打开你希望转换的英语文章

5，选择“工具”菜单下的“转换为媒体文件”，建议创建一个新目录，命名为“男声”，然后填写一个文件名，例如“对话_句”后“保存”，这样就在“男声”这个文件夹中得到（对话_句3、对话_句3、对话_句3。。。）

6，等待转换完成，转换根据文章的大小，需要大量的磁盘空间，如果空闲的磁盘空间太小会转换失败

7，再回到第2步，这次选择一个英文女声朗读角色作为“英文朗读者”

8，转到第5步重新转换一次，这次新建一个“女声”的文件夹，填写的文件名一样，然后“保存”，这样就在“女声”这个文件夹中得到（对话_句3、对话_句3、对话_句3。。。）

9，这样你就得到了所有用男声朗读的句子和所有用女声朗读的句子，你可以在这两个目录中挑选需要的内容最后形成男女声对话，可以再创建一个目录，命名为“对话”，将挑出来的文件复制到这个目录下，例如挑出“男声”目录下的“对话_句3”，挑出“女声”目录下的“对话_句3”，再挑出“男声”目录下的“对话_句3”，以此类推

10，需要播放这个对话的时候，就把“对话”目录中所有MP3文件在支持播放列表的媒体播放器中打开，只要播放列表的顺序正确，就能得到完美的对话了

1，实际效果演示

“百见不如一闻”，我们用《新概念英语》中的一篇短文来实际感受一下使用“能说会道 XP”制作中英文资料的具体效果：

Last week I went to the theatre.

上星期我去看戏。

I had a very good seat.

The play was very interesting.

I did not enjoy it.

我的座位很好，戏很有意思，但我却无法欣赏。

A young man and a young woman were sitting behind me.

They were talking loudly.

一青年男子与一青年女子坐在我的身后，大声地说着话。

I got very angry.

I could not hear the actors.

我非常生气，因为我听不见演员在说什么。

I turned round.

I looked at the man and the woman angrily.

They did not pay any attention.

我回过头去怒视着那一男一女，他们却毫不理会。

In the end, I could not bear it.

I turned round again.

'I can't hear a word!' I said angrily.

最后，我忍不住了，又一次回过头去，生气地说：“我一个字也听不见了！”

‘It’s none of your business,' the young man said rudely. 'This is a private conversation!'.

“不关你的事，”那男的毫不客气地说，“这是私人间的谈话！”

使用如下语音包时的效果：

英文语音角色：Microsoft Mary

中文语音角色：ScanSoft Mei-Ling_Full_22kHz

音频格式：22kHz 16Bit Mono

制作的MP3下载：/addition/demo_mary_

使用如下语音包时的效果：

英文语音角色：VM Julie

中文语音角色：VM Hui

音频格式：16kHz 16Bit Mono

制作的MP3下载：/addition/demo_julie_

从上述使用不同的语音角色进行转换的结果看，下面那个使用VM（即NeoSpeech）语音角色的效果相对更好。因此，要使制作的语音资料更完美，譬如用于制作“真人播音片段”或者“语音广告”等，那么选择一个专业的语音角色是王道。我们这里推荐专业用户选择NeoSpeech的语音角色包。

2，安装质量更好的语音包

如果希望获得专业级的语音质量，我们推荐您使用NeoSpeech的语音包，具体请参考：

NeoSpeech语音合成引擎

3，选用合适的音频格式设置

每个语音角色都有它的“本征分辨率”，就好像上文中讲到，使用NeoSpeech的语音包时，需要将“音频格式”设置为16kHz 16Bit时才有最好的效果，而其他语音包这需要设置为“22kHz

16bit”，这就是语音角色默认的音频格式，采用语音角色的默认音频格式时不需要额外的转换与处理，因此能保证最佳效果。

那么具体如何确定每个语音角色的默认音频格式呢，当然首先是看该语音角色的使用说明，可能包含了这些基本信息。如果没有默认格式的说明，那么您可以通过试听的方法来获知哪种“音频格式”设置下具备最好的效果。具体方法是：首先将“朗读时总使用最优质量”的打钩去掉，这样在平时朗读时就能获得与转换MP3相同的效果。然后换用不同的“音频格式”设置，用软件播放一下，听听哪个设置下具备最好的效果即可。

另外，尽量不要让两种具备不同最佳音频格式的语音包同时使用（即某个作为英文朗读角色，另一个作为中文朗读角色），因为这样会顾此失彼，导致某种语言的朗读效果较好时，另一种却不行，当然这仅在制作MP3时会出现，在使用软件直接播放时，只需要选中“朗读时总使用最优质量”就可以分别使用各自的最佳音质。

4，启用“可变比特率”MP3编码

如果您希望直接制作出最终使用的音频文件，并且希望便于携带等，那么建议您使用“可变比特率”的MP3编码方式，这可以让你生成的MP3文件大小适中，又能保持最佳音质。

如果您希望制作出的语音资料能够进一步加工，譬如增加背景音乐等，那么建议您直接保存为Wav文件，这将方便后期合成与进一步处理。

最近收到多位用户来信和留言，均提及“复读”功能：

用户一：

自从购买了贵公司的能说会道xp后，为我的教学工作提供了极大的帮助。我最关注的就是能将文本转换成声音并同时制成MP3文件。

但在使用过程中，非常需要在转成MP3后，每句之间增加一定时间的停顿（就象在“能说会道xp”软件中那样），不知能加上这个功能否？

再者，在软件中播放文本，现在已经能实现手工复读，如果能指定复读次数后，按句子自动实现复读，那就更实用了。

请问我这两个愿望能在今后升级中实现否？谢谢！

用户二：

我想说说我在使用能说会道中遇到的问题：在导出MP3的时候，原来设置的句间停顿的时间，无法体现，比如说，我设置的句间停顿时间为3秒时，在软件直接朗读时会停顿3秒钟，但在导出的MP3文件时，发现就没有停顿时间了，我希望能改进这个缺点，同时，我也提点改进意见：最好软件设置得除了中英文的句间都可以停顿外，还有就是中英文句子朗读的次数最好能增加上去

于是，在接下来的V2.73版中，将会提供如下功能：

1，自动按句重复朗读功能：

参考如下设置界面，此设置表示的意义是在每个句子正常朗读一次的情况下，额外重复朗读的次数，也就是说，如果设置重复朗读次数是1次，那么加上原本就会朗读的1次，实际上会将每个句子朗读2次。

2，“所听即所得”：

句子间停顿设置、上述自动按句重复朗读设置，均同时在导出MP3时生效，可谓“所听即所得”，即MP3导出的效果与软件朗读时完全一致。（输出方式请选择“全文输出”，在“分句输出”时停顿设置有效，但重复设置无效，原因是完全生成几个一样的MP3文件没有必要）

界面一览

下载：

请访问下载页面：

本文标签：语音朗读设置使用停顿

版权声明：本文标题：几种TTS软件的安装内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1706822754a182157.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

几种TTS软件的安装

更多相关文章

无线路由器如何设置多个SSID账号

cisco胖apssid设置

win7 微软语音服务器,win7 TTS修复工具(微软tts语音引擎修复)

沸腾新十年 | 中国语音产业江湖和科大讯飞的前半生...

语音处理语音识别基础（二）- 声音的存储

讯飞+按键精灵实现语音控制电脑

市场占比 44%，IDC 最新报告：阿里云智能语音市场排名第一

chatgpt赋能python：让Python开口说话：使用文本合成技术生成语音

QQ语音老是连接服务器超时,手机QQ提示连接超时请检查网络设置解决办法

基于Python+百度语音的智能语音ChatGPT聊天机器人（机器学习+深度学习+语义识别）含全部工程源码 适合个人二次开发

Windows 实时语音转文字|免费语音视频翻译转文字|语音会议记录方案

解决photoshop菜单卡顿，闪动，停顿问题

SER 语音情感识别-论文笔记1

苹果手机语音备忘录在哪_苹果手机删除的备忘录怎样找回？方法简单，3秒学会！赶紧来看...

qt调节linux系统音量,QT语音声音小怎么办？QT语音各种声音调节教程

怎么用计算机改变声音的音调,男声变女声用什么软件？能电脑语音说话变声吗？...

电脑qq语音连不到服务器,电脑问题：qq语音正常？

如何通过语音遥控器扩展Amazon Echo的覆盖范围

将小爱音箱接入 ChatGPT 和豆包，改造成你的专属语音助手

Chrome浏览器语音自动播放功能

发表评论

推荐文章

OR Paper Weekly(一) | 用机器学习生成列生成的列，元启发式算法=动物世界？看OR68年发文数据，哪国位居榜首？

Precision T7910 图形工作站win7和linux双系统安装

小云路由器mysql地址_小云路由器助手

Player 本地播放器推荐-倍速播放-本地视频播放器-播放器-电脑手机互传文件-附下载地址

苹果电脑怎么读取ntfs磁盘?有哪些可以读取苹果电脑硬盘的软件?

热门文章

OAuth模块管理客户端的用户登录鉴权功能，允许应用访问第三方平台的资源

浏览器的选择

win10快捷键大全 win10常用快捷键

AMD主板分类

ThinkPad Tablet2升级Windows10(各种故障及解决方案)

Windows10系统安装软件后软件界面异常（变得很小或很大），界面显示不完全的解决方案

联想G40 U盘装系统问题解决

wd移动硬盘不能识别_西数移动硬盘电脑提示无法识别USB设备怎么办

移动硬盘显示加密，怎么处理。

cp18_Reinforcement Learning for Markov Decision Making in Env_Bellman_Q-learning_Q-Value Iteration

最新文章

xp-win7远程桌面的设置（安装win7终端服务器）

XPWIN7系统中删除残留托盘图标的方法

win7招不到网络计算机,用一招提高家里的网速 Win7网络双工模式设置教程

Oracle数据库从Window XP迁移到Win7的诡异问题

电脑安装win7系统后没有声音怎么办

借win11 WSA升级12l，水一贴升级方法和说说要不要升级win11。

如何在win7下升级vs2008

win7字体安装_超强大PDF编辑软件 | Adobe Acrobat DC安装教程

xp新电脑win7重装硬盘SATA模式AHCI及ACPI电源管理zz150118

Notepad2 在Win7 64位下替换系统notepad

Win7 64位操作系统中安装Microsoft Access Engine

java开发用win7好还是win10_Win10和Win7各有优点，大家不要再纠结哪个系统更好了！...

win7蓝屏_win7电脑蓝屏自动重启怎么办，卸载程序，电脑瞬间复活

win7添加一个计算机图标,Win7系统任务栏处添加“计算机”图标的方法

64位系统魔兽服务器不兼容,魔兽世界Win7下出现不兼容问题的解决办法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

基于Python+百度语音的智能语音ChatGPT聊天机器人（机器学习+深度学习+语义识别）含全部工程源码适合个人二次开发

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载