so-vits-svc 3训练人生模型步骤:
1、人声数据的提取、消除杂音、切割成10秒的小片段
如果是音乐可以通过Ultimate Vocal Remover | UVR5,抽取人声,下载地址:https://github.com/Anjok07/ultimatevocalremovergui/
杂音消除:RX Audio Editor,消除噪音,高质量数据源
下载地址:https://pan.baidu.com/s/1xUXd9vVHR11sjJ6wCVuwHQ?pwd=hjhj
提取码: hjhj
切割audio-slicer:https://github.com/flutydeer/audio-slicer/releases
2、 将准备好的数据集放置在 .\dataset_raw\ 文件夹中,确保文件夹结构正确:
dataset_raw├───speaker0
│ ├───xxx1-xxx1.wav
│ ├───...
│ └───Lxx-0xx8.wav
└───speaker1
├───xx2-0xxx2.wav
├───...
└───xxx7-xxx007.wav
3、依次执行以下几个命令就能训练自己的声音模型了
svc pre-resample
svc pre-config
svc pre-hubert
svc train -t
4、使用模型也很简单
选择模型及config,还有源声音文件,点击infer即可生成用模型声音转换的新声音
点击start voice charge可开启实时换声
网友回复
python如何实现torrent的服务端进行文件分发p2p下载?
如何在浏览器中录制摄像头和麦克风数据为mp4视频保存下载本地?
go如何编写一个类似docker的linux的虚拟容器?
python如何写一个bittorrent的种子下载客户端?
ai能通过看一个网页的交互过程视频自主模仿复制网页编写代码吗?
ai先写功能代码通过chrome mcp来进行测试功能最后ai美化页面这个流程能行吗?
vue在手机端上下拖拽元素的时候如何禁止父元素及body的滚动导致无法拖拽完成?
使用tailwindcss如何去掉响应式自适应?
有没有直接在浏览器中运行的离线linux系统?
nginx如何保留post或get数据进行url重定向?