声音模型是实现变声翻唱等声音转换的前提。在克隆声音网站里,用户有四种途径使用声音模型。
第一种:RVC模型社区,也就是声音库,这里有许多用户公开免费的高质量RVC声音模型,其中一些是明星的声音模型;
第二种:上传声音模型,如果你有RVC声音模型,里面有一个.pth格式的模型文件,可以在模型社区上传;
第三种:在网站训练RVC声音模型,不仅可以训练自己的声音模型,还可以训练他人的声音模型;
第四种:手机训练RVC声音模型(公众号“绘声美音”),适合训练自己的声音模型。
在网站内训练声音模型步骤
训练模型(即炼丹),是提取声音特征,将音色保存到模型文件的过程。
clonevoice.net是一个训练声音模型的网站,所以不管你用windows还是mac甚至智能手机,都能在浏览器里制作声音模型,下载声音模型文件。
一、RVC模型训练
登录网址:https://clonevoice.net/v2/
点击“声音库”菜单,再点击右边的“训练模型”,如下图:
二、训练素材要求
训练素材即声音样本,为保证模型效果,请确定
a、录音质量高:最简单的办法是自己在安静的环境下朗读一段文案,唱一段歌曲,或者在录音棚里录制。如果是明星的声音,可以下载高清的音乐或视频(只有一个人说话,不要有两个以上人的声音)。不用担心这些音视频有背景音,有混响,因为系统训练模型是自带分离背景音、去混响、分离伴奏功能。
b、总时长3分钟到30分钟:指正常说话的声音,说话过程停顿不要超过3秒。
c、声音内容:如果模型是用于翻唱歌曲,那么上传的音频尽可能有这首歌,比如你想翻唱刘德华的《忘情水》,那么就上传你自己唱的《忘情水》。不必担心唱歌的准确性,但是要歌曲的高音和低音唱出来,因为平台是要提取声音特征。