前言
MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具
应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了,当然,有什么好的意见建议可以继续留言告知(提示:少数人需要的特殊功能不在此范围,真有需要可联系定制)。
当前版本:v1.9.3
更新内容:
- 1、修复几个基于1.9版本的逻辑bug;
声明:本软件完全免费,有网友反映MS-TTS已被人拿到闲鱼、淘宝等平台进行售卖,如果刚好被你看到,请退货+举报+差评,谢谢!
正文
微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。
注意:
1、记得先解压,然后使用管理员模式运行程序!
2、简单模式-超长文本:导入的txt文件编码必须为utf-8,文件大小不要超过5MB
;
3、试听功能:试听范围为主体内容前150字符;
4、SSML模式:试听模式主体内容长度不得超过150字符,合成模式主体内容长度不得超过2500字符;
Bug反馈
遇到问题请先更新到最新版本试试!如果还是解决不了,请在公众号回复:加群
,添加Q群后,提供触发Bug的具体场景,以便跟踪修复,感谢有你!
视频教程
https://www.bilibili.com/video/BV1wg411k7SH/
界面说明
左侧最上方为合成语音质量选项,目前软件支持两种格式,分别为MP3和WAV,每种格式分别有四种质量,请根据实际需求设置调整;
左侧中间有Proxy选项(由于TTS服务器在国外,网络非常不稳定,所以增加了这个选项,有条件就用,如果没条件且又很卡的话,那就换个时间再试,实测:在下半夜及上午时间段,使用效果更好!)
左侧下方为需要配音角色选项,及添加角色按钮,既缩小了界面尺寸,又可以添加更多的角色(最多6个角色),使用方法也很简单,如果你不需要多角色,那么直接在角色里调整好就可以试听合成了,如果是多角色,那么先需要设置好角色选项,然后添加角色,每个角色都需要相同操作,在所有角色添加完成后,右侧文本区选择文本,鼠标右键--设置角色--选择对应的角色即可;
右侧是文本内容区域,以及试听
、合成
、停止
、保存配置
功能按钮。
注:保存配置无法保存添加的角色信息,后续版本可能会改进
不设置角色时,软件默认使用左侧角色设置。
新角色
注意,新角色微软官方定义为测试角色,所以并不是完全开放,如果你选择使用这两个角色,下方出现如下图的提示,则说明当前微软未开放,以后再试吧。
多音字
MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,
将需要自动替换的内容按照:原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,如下:
语音合成
前提工作准备好就可以点击右侧上方的
试听
或合成
按钮,开始进行语音试听或合成注意:文本内容越多,合成所需时间越长!
中小文本合成完成后,音频在工具目录下的“audio\日期时间子目录”中,如下:
超长文本语音合成完成后,音频在工具目录下的“audio\文本文件名称”文件夹中,如下
语音合成完成后,将自动调用ffmpeg进行合并。
软件报病毒
软件有加密保护,会被部分杀软误报,不放心请勿使用
,谢谢合作。
123 条评论
win11打不开
不知道为啥没有之前速度快了 之前转换速度贼快
@治廷君 解决下超长文本的问题,用不了。总是显示找不到指定路径。
仔细阅读上面的文章内容你就可以看到:如果遇到Bug请在公众号回复:加群,添加Q群后,提供触发Bug的具体场景,以便跟踪修复,感谢有你!
这更新速度,生产队的驴也就这样了
连接超时
1.8.1还是超时
更新1.8.1后还是链接超时
好像超长文本不能用呀
1.8版本全部都连接超时啦,治廷君
已更新
都边接超时啦
已更新
1.81的还是连接超时
支持作者。
建议新增合成的音频文件自动命名的规则,并且只保留一段合并后的音频文件。
希望能加入字幕文件朗读功能
大佬,好像声调用不了没反应啊,还有就是能否加入一些功能设置每句话是否需要停顿之类的,有时候一段话是要连续读的,但他会有停顿。如果有魔音工坊破解的就好了
非常棒,我使用的版本是1.7 感觉很棒,我是用来听小说的,我在官网上使用文本的时候一般能达到10分钟的语音长度下载,这里一段最多是4分多钟,我有用ffmpeg合成,但还是想让他更长点
补充,Microsoft还有几个新增的语音云泽和云夏,云泽很适合听那种故事很深很神秘的小说,微软的tts真的是世界第一。我完全离不开它。我还自建了。。只是有时候流量顶不住,所以就找找离线,居然被我找到了,作者真的牛。大赞
我也想要离线的。请问能给我一份,或告知地址吗/
管理员作者你好,我有个想法,希望你回复下,时候你可以写一个 能读TXT格式,SRT格式的,带时间轴的语音合成那,那就厉害了,可以按照视频配的CC字幕来做自己想要的语音了, 因为下载的某个视频里有CC字幕,下载完都是带时间轴的,带时间轴的如果能合成有音就好了,合成语音的时候可以跳过时间轴部分,但是需要检测时间轴里的语音时间 什么时候发言。
为啥没有最新版本的下载地址呢
因为不懂的人永远不懂
666
我在想能不能多线程下载,这样会快很多。还有命名的规则能不能把序号长度统一 一下?
多线程在很早前就已经在写了,一时半会肯定还不行,慢慢来
这软件太好用了,作者牛叉,孩子学英语希望能中英混读,方便学习
最近的新版本,使用起来总是提示网络不佳,没法生成。
我的电脑是win10 刚开始 ffmpeg 可以自动合成,这几天 刚开始合成,ffmpeg就开始闪退 ,不知是啥原因?
右键-使用管理员权限运行,试一下
角色数量能再增加吗?好像不够用。→_→
下个版本考虑增加
你好大佬,使用了一段时间有个新问题,如何缩短每次语音之间的间隔?语速拉快之后间隔就显得比较突出,有点怪异,简单模式也不知道该怎么设置
大佬,有个问题,到处选项能不能追加个wav啊。MP3会损失音质。,。。。万分感谢
你搜一下read aloud,是wav格式,但是最近有点抽风,时不时用不了
v1.6.1版本准备试听语音合成,请稍后......等了好久弹出 is not a valid integer value
大神,请问有没有开发mac版本的打算?
管理员作者你好,我有个想法,希望你回复下,时候你可以写一个 能读TXT格式,SRT格式的,带时间轴的语音合成那,那就厉害了,可以按照视频配的CC字幕来做自己想要的语音了, 因为下载的某个视频里有CC字幕,下载完都是带时间轴的,带时间轴的如果能合成有音就好了,合成语音的时候可以跳过时间轴部分,但是需要检测时间轴里的语音时间 什么时候发言。
文字如果多,使用定于多人朗读编辑时候 超过一个页面再编辑自动返回 第一页,又要找编辑到哪里了 ,希望优化下 谢谢
首先感谢大神能分享这么好的工具。再反溃一个问题。比如:牧,就一个读音,第四声。如果是“牧羊”,它会读成第四声,是正确的。如果是“放牧”且在句尾,它就会把牧读成第一声,听起来怪怪的。还有字句之间停顿的问题,能否自定义呢。
大佬,这个好像不支持mac哈
反馈一下使用存在的问题:
1、多音字不一定就是相同读音上的声调变化,如“单”有shàn、chán、dān三个读音,如此以来,就需要找同音字替代,只是变声调无法改变读音;如果多音字的设置改为音节加数字声调就方便多了,如“单”shan4、chan2、dan1,若为轻声可不标数字声调,或标记成5也行。
2、解除多角色语音与风格限制,可参照“试用精简版有声内容创作”:https://speech.microsoft.com/audiocontentcreation
tts下载后360拦截并提示Win32/trojan.Generic.GgIASsIA.
装什么360这年头, 什么都不用装
杀毒软件误报,解决方法:一、暂停杀毒软件,二、添加白名单,三、直接删除,不要使用
一运行就被ESET干掉了,Win32/Packed.Themida.HFL.晕!
杀毒软件误报,解决方法:一、暂停杀毒软件,二、添加白名单,三、直接删除,一了百了
我很期待 能合成带时间轴的语音 SRT字幕类型最佳了。
生成语音再导入剪映,里面不是有字幕吗
基本不用想,你这个功能太费脑了。
管理员作者你好,我有个想法,希望你回复下,时候你可以写一个 能读TXT格式,SRT格式的,带时间轴的语音合成那,那就厉害了,可以按照视频配的CC字幕来做自己想要的语音了, 因为下载的某个视频里有CC字幕,下载完都是带时间轴的,带时间轴的如果能合成有音就好了,合成语音的时候可以跳过时间轴部分,但是需要检测时间轴里的语音时间 什么时候发言。
连接超时是怎么回事作者
已经成功解决୧(๑•̀⌄•́๑)૭
反馈一个问题,文件合并前的mp3是128k的,但是自动合并后的总文件变成24k的了,麻烦看看这个是原开发设计还是bug?谢谢啦。
此bug已修复,下个版本更新,感谢反馈!|´・ω・)ノ
这个版本不错,特别是网络断开重试,省的一次次重新导入重新开始弄了。
有BUG啊亲,设置了AB两个音色,最后一段音频会默认改回A音色。。。。
150版本还未修复。。。。。
150版本电脑会提示:音频dll加载失败错误,界面也加载不出来,鼠标扫过才会显示出按钮等。。。
我也是 前几个都用着蛮好的 150不行了
感觉还是要增加预览功能,点击预览直接播放该配置的语音,前一两百字就好,这样增加软件易用性,小小的建议哦、OωO
下个版本增加试听功能,试听范围:每段文本前100字符。|´・ω・)ノ
用了一下午回来感叹下,你太棒了太棒了!之前用一两次总是没反应,要不断重新打开,现在这版速度很快,好顺手呀,真优秀鼓掌鼓掌!
连接超时
(同时取消英文角色风格,没人用); 有人用哇!!!!!!!!!!!!!!!!!!!!!!!
我也需要,希望博主给加上,能加上日语的更好!!!
另外,博主 新版本更新后老版本就不能使用了,能不能不强制更新,既可以使用新版本也可以使用老版本啊
如果能输出字幕就爽呆了ヾ(≧∇≦*)ゝ
大佬,MS-TTS哪里可以下载
下载地址已更新
英文能不能加个英式英语呀~(可以等,可以等)
下个版本,打卡!
真棒~
建议增加其他语种选项。
加个预览播放吧 调音太难了
这个可以先去微软主页调试。
可以搞个预览吗高手
可以先去微软主页预览。
失败,检测到病毒
大佬可以增加这几个功能吗
1、解除5w的字数限制
2、然后如果当前这段文本比如10分钟没有下完就,自动重新尝试下载
3、或者跳过失败这段先尝试下载下一段,后续再重新尝试失败的这一段文本
最新的1.3.2版本,好像有5w的字数限制 可以取消这个限制吗
厉害厉害!!!!!!!!!!!
大佬俺又来了~不知道为什么我每天好像只能用两次,后面不管怎么输入都变成“准备语音合成,请稍后。。。”最早的旧版本很顺滑,后来更新ABC角色就只能用两次,这次加入情感之后还是只能用两次,有没有什么解决办法呀!
蹲一个,我也是这样
老大,大赞,谢过。有个小细节还可以修改一下,语音风格似乎因人而不同,选项内容数量不同,内容也有不同。另外,翻译出现两个“抒情”。当然,如果都是按顺序选,也没必要修改,费事。
“风格”选项干脆不翻译,直接用英文?
老大,我测试了一下。在微软官网页面,“云扬”之下只有4个选项,其中narration profession是独有的。我在软件里,前四个选项都试了一下,好像输出的结果都是“一般”,当然也就没有narration profession。
风格选项每个角色不一样,我比较懒,没有一个个安排,不支持的选了没效果
老大,恳请把云扬的风格弄一弄。这样也就行了,一个晓晓女、一个云扬男,满足基本需求。而且,云扬的narration profession风格太酷了,不能合成进去很遗憾,用这声音来朗读堪称完美。
首先感谢开发者接受上次的建议:加入了情感选项 ,并且还增加了比特率以及语速的设置
那么新的建议如下:
1.对于选中的这些功能加入配置文件保存,方便下次启动无需再次调整
2.能否再合成按钮前面,增加一个试听按钮,效果不错再决定是否合成
大佬,之前版本没用过,现在1.3版本不管选哪个角色的语音,语音合成后都会再附加合成一个A角色的语音,请问是有意为之还是BUG?
已更新到1.3.2版本
如果能想办法 添加上 微软官网的情绪选择那个选项就好了。
非常感谢
已经添加
FFmpeg压缩包解压后找不到bin文件夹 怎么破?
大佬,我昨天用的时候还是好好的,为什么今天再用突然.exe的可执行程序就消失了。重新解压后可以看靠那个.exe文件从有到消失,这是为什么呢?
杀毒软件误杀
工具不错,不知道为什么自动合并不了,安装ffmpeg了,软件目录下也有合并文件,打开就是无效,显示0字节
检查一下路径中是否存在中文或是空格
如果支持ssml 就太棒了!!可以利用微软的SSML 调节语句的语气语调了!~~
大佬~发现一个小小的bug,不知道后面会不会优化❤软件自动分割会把一个英文单词分两半,比如unknown,读成unk-nown,比如know读成k-now,哈哈哈如果可以修复的话希望后面会更棒呀~~
后续优化
能不能加上试听的功能,里面好几个角色,有时候要试听一下再导出
请问这个工具后期会收费吗
不会
谢谢大佬~点合成总是没有反应,是网络本身的问题吗
可能是网络问题,也有网友发现也可能是被windows defender拦截了,具体需要你自己判断是哪种情况了
君哥 最近tts不好使了
大佬,现在感觉生成速度变慢了,而且操作更繁琐了,可否在不选择配音演员的情况下默认用配音A
单角色操作可以用快捷键ctrl+a 全选,右键--角色A,感觉也还好吧
生成速度和以前没有什么区别,至于操作繁琐,这是为了增加多角色的牺牲,你的建议不错,记下
,
太实用了,谢谢!|´・ω・)ノ
有限制吗?
文字有字数限制吗?
建议添加上情绪选择
可否实现朗读英文单词的时候:女声一遍、男声一遍、中文解释一遍?谢谢!!!
打卡记录一下!
成功率不是很高 不知道为啥
工具对接的是微软TTS官方网站接口,服务器在国外,有条件科学一下会更好
我打开了翻墙软件直接开启是否对接上了呢?,在加几个魔音工坊收费人声就更完美了,你也可以适当的收点费用