白嫖微软最像人的AI合成语音库(azure TTS API)二

同和1 · 发表于 2022-5-14 11:22:12

本帖最后由同和1 于 2022-5-14 11:23 编辑

再次分享一个白嫖微软语音的方法，觉得这个更好用。

安装

$ pip install --upgrade aspeak
由于帖子有字数限制 “使用方法” 就请各位小主到GitHub上看吧链接在文末例子
说“你好，世界！” 到默认扬声器。$ aspeak -t "你好，世界"
列出所有可用的声音。$ aspeak -L
列出所有可用的中文语音。$ aspeak -L -l zh-CN
获取有关声音的信息。$ aspeak -L -v en-US-SaraNeural
输出
将合成语音保存到文件中。$ aspeak -t "你好，世界" -o output.wav
如果你更喜欢 mp3/ogg/webm，你可以使用//--mp3选项。--ogg--webm
$ aspeak -t "你好，世界" -o output.mp3 --mp3
$ aspeak -t "你好，世界" -o output.ogg --ogg
$ aspeak -t "你好，世界" -o output.webm --webm
列出可用的质量级别和格式$ aspeak -Q
输出
提高/降低音频质量#低于默认质量。
$ aspeak -t " Hello, world " -o output.mp3 --mp3 -q=-1 # mp3 的最佳质量
$ aspeak -t " Hello, world " -o output.mp3 --mp3 -q=3
从文件中读取文本并说出它。$ 猫输入.txt | 说话
或者
$ aspeak -f 输入.txt
使用自定义编码：
$ aspeak -f input.txt -e gbk
从标准输入读取并说出它。$ aspeak
或（更详细）
$ aspeak -f -
也许你更喜欢：
$ aspeak -l zh-CN << EOF我能吞下玻璃而不伤身体。EOF
说中文。$ aspeak -t "你好，世界！" -l zh-CN
使用自定义语音。$ aspeak -t "你好，世界！" -v zh-CN-YunjianNeural
自定义音高、速率和风格$ aspeak -t "你好，世界！" -v zh-CN-XiaoxiaoNeural -p 1.5 -r 0.5 -S sad
高级用法使用自定义音频格式进行输出注意：输出到默认扬声器时，使用非 wav 格式可能会导致白噪声。
$ aspeak -t " Hello World " -F Riff48Khz16BitMonoPcm -o high-quality.wav
定制风格度和作用根据 Azure 文档，风格度指定说话风格的强度。它是介于 0.01 和 2 之间的浮点数，包括 0.01 和 2。
在撰写本文时，支持中文（普通话、简体）神经语音的风格程度调整。
根据 Azure 文档，role指定了口语角色扮演。声音表现为不同的年龄和性别，但声音名称没有改变。
在撰写本文时，这些中文（普通话、简体）神经语音支持角色调整： zh-CN-XiaomoNeural、zh-CN-XiaoxuanNeural、zh-CN-YunxiNeural和zh-CN-YunyeNeural。
来来源：https://github.com/kxxt/aspeak