tts更换模型和训练

定制tts模型(克隆音色)

注:本模块需要在完成虚拟环境配置后进行

该模块可以使用一段音频一键克隆你想要的角色的音色

音频要求:长度在10min~30min之间,mp3格式,可以有背景音乐,但是只能有一个说话人

硬件要求:显存至少6G的显卡

1.把你的音频文件放在fine_tuning/input文件夹下,改名为"audio.mp3",如图

image

第一次用的时候这个位置会有一个占位符.txt,建议删掉,不删也没关系,但是会有些不影响进程的报错

2.这一步需要科学上网运行

双击运行 一键克隆音色.bat ,在弹出的窗口中输入你的音频使用的语言以及你的tts模型的名称(自己起一个,示例使用"1"),如图

image

键盘上随便按一个键就可以继续

在脚本运行期间不要关闭窗口!!!

3.脚本运行完成后,修改配置以使用你训练好的模型

前往live-2d文件夹内打开肥牛.exe

按照图中的顺序配置好你的音频模型

QQ20251023-160807

最后点击“生成TTS的bat文件。会在live-2d文件夹中的Voice_Model_Factory文件夹下生成你的bat格式的文件。只需要双击运行。你训练好的tts的服务即可启动

接下来就可以启动皮套。模型就会以训练后的声音和你对话了。