tts更换模型和训练
定制tts模型(克隆音色)
注:本模块需要在完成虚拟环境配置后进行
该模块可以使用一段音频一键克隆你想要的角色的音色
音频要求:长度在10min~30min之间,mp3格式,可以有背景音乐,但是只能有一个说话人
硬件要求:显存至少6G的显卡
1.把你的音频文件放在fine_tuning/input文件夹下,改名为"audio.mp3",如图
第一次用的时候这个位置会有一个占位符.txt,建议删掉,不删也没关系,但是会有些不影响进程的报错
2.这一步需要科学上网运行
双击运行 一键克隆音色.bat ,在弹出的窗口中输入你的音频使用的语言以及你的tts模型的名称(自己起一个,示例使用"1"),如图
键盘上随便按一个键就可以继续
在脚本运行期间不要关闭窗口!!!
3.脚本运行完成后,修改配置以使用你训练好的模型
前往live-2d文件夹内打开肥牛.exe
按照图中的顺序配置好你的音频模型
最后点击“生成TTS的bat文件。会在live-2d文件夹中的Voice_Model_Factory文件夹下生成你的bat格式的文件。只需要双击运行。你训练好的tts的服务即可启动
接下来就可以启动皮套。模型就会以训练后的声音和你对话了。