基于 MSST 和 Wav2Svp 修改,可一键分离伴奏及人声,并根据人声生成工程,工程支持 Synth V (svp) 和 OpenUtau (ustx)
- 安装PyTorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
- 安装依赖
pip install -r requirements.txt
- 命令行推理
python wav2ustx.py 歌声路径 输出路径 -t 曲速 -s 启用步骤
- webui推理
python webui.py
可选值: vocal_separation, harmony_removal, deverb, denoise
注意事项: 每步要用英文逗号 , 分隔。
人声分离: model_bs_roformer_ep_368_sdr_12.9628
去除和声: model_mel_band_roformer_karaoke_aufr33_viperx_sdr_10.1956
去除混响: deverb_bs_roformer_8_256dim_8depth
去除噪声: denoise_mel_band_roformer_aufr33_aggr_sdr_27.9768
midi提取: model_steps_64000_simplified (点击下载)
f0提取: rmvpe (点击下载)
MSST-WebUI: https://github.com/SUC-DriverOld/MSST-WebUI