|
本帖最后由 同和1 于 2022-5-14 11:23 编辑
再次分享一个白嫖微软语音的方法,觉得这个更好用。
安装
$ pip install --upgrade aspeak
由于帖子有字数限制 “使用方法” 就请各位小主到GitHub上看吧 链接在文末例子
说“你好,世界!” 到默认扬声器。$ aspeak -t "你好,世界"
列出所有可用的声音。$ aspeak -L
列出所有可用的中文语音。$ aspeak -L -l zh-CN
获取有关声音的信息。$ aspeak -L -v en-US-SaraNeural
输出
将合成语音保存到文件中。$ aspeak -t "你好,世界" -o output.wav
如果你更喜欢 mp3/ogg/webm,你可以使用//--mp3选项。--ogg--webm
$ aspeak -t "你好,世界" -o output.mp3 --mp3
$ aspeak -t "你好,世界" -o output.ogg --ogg
$ aspeak -t "你好,世界" -o output.webm --webm
列出可用的质量级别和格式$ aspeak -Q
输出
提高/降低音频质量#低于默认质量。
$ aspeak -t " Hello, world " -o output.mp3 --mp3 -q=-1 # mp3 的最佳质量
$ aspeak -t " Hello, world " -o output.mp3 --mp3 -q=3
从文件中读取文本并说出它。$ 猫输入.txt | 说话
或者
$ aspeak -f 输入.txt
使用自定义编码:
$ aspeak -f input.txt -e gbk
从标准输入读取并说出它。$ aspeak
或(更详细)
$ aspeak -f -
也许你更喜欢:
$ aspeak -l zh-CN << EOF我能吞下玻璃而不伤身体。EOF
说中文。$ aspeak -t "你好,世界!" -l zh-CN
使用自定义语音。$ aspeak -t "你好,世界!" -v zh-CN-YunjianNeural
自定义音高、速率和风格$ aspeak -t "你好,世界!" -v zh-CN-XiaoxiaoNeural -p 1.5 -r 0.5 -S sad
高级用法使用自定义音频格式进行输出注意:输出到默认扬声器时,使用非 wav 格式可能会导致白噪声。
$ aspeak -t " Hello World " -F Riff48Khz16BitMonoPcm -o high-quality.wav
定制风格度和作用根据 Azure 文档 ,风格度指定说话风格的强度。它是介于 0.01 和 2 之间的浮点数,包括 0.01 和 2。
在撰写本文时,支持中文(普通话、简体)神经语音的风格程度调整。
根据 Azure 文档 ,role指定了口语角色扮演。声音表现为不同的年龄和性别,但声音名称没有改变。
在撰写本文时,这些中文(普通话、简体)神经语音支持角色调整: zh-CN-XiaomoNeural、zh-CN-XiaoxuanNeural、zh-CN-YunxiNeural和zh-CN-YunyeNeural。
来来源:https://github.com/kxxt/aspeak
|
|