网安引领时代,弥天点亮未来
VITS 的工作流程如下:
(1).将文本输入 VITS 系统,系统会将文本转化为发音规则。
(2).将发音规则输入预先训练好的语音编码器 (vocoder),vocoder 会根据发音规则生成()
(3).语音信号的特征表示。
(4).将语音信号的特征表示输入预先训练好的语音合成模型,语音合成模型会根据特征表示生成合成语音。
(5).VITS 的优点是生成的语音质量较高,能够生成流畅的语音。但是,VITS 的缺点是需要大量的训练语料来训练 vocoder 和语音合成模型,同时需要较复杂的训练流程。
语音模型的训练教程可以参考下面这篇文章
(1).https://www.bilibili.com/read/cv20598500。
(2).选择这篇文章的理由,过程简单好理解,废话少。
训练好的模型可以使用下面的工具合成语音
(1).GUI版本:
https://github.com/CjangCjengh/MoeGoe
(2).python版本:
https://github.com/CjangCjengh/MoeGoe
(3).在线API接口
https://github.com/fumiama/MoeGoe
别人训练好的模型效果视频演示
(1).在线地址:
https://huggingface.co/spaces/sayashi/vits-models
8.欢迎大家关注弥天安全实验室公众号。
9.文章来源参考:
(1).https://huggingface.co/spaces/sayashi/vits-models
(2).https://www.bilibili.com/read/cv20598500
(3).https://www.bilibili.com/read/cv20837189
(4).https://www.bilibili.com/read/cv21342054/
(5).https://github.com/CjangCjengh/MoeGoe
(6).https://github.com/CjangCjengh/MoeGoe_GUI
知识分享完了
喜欢别忘了关注我们哦~
弥 天
安全实验室