真黎葡也能心满意足的【音频分离教程】

您所在的位置:网站首页 自制反相器 真黎葡也能心满意足的【音频分离教程】

真黎葡也能心满意足的【音频分离教程】

#真黎葡也能心满意足的【音频分离教程】| 来源: 网络整理| 查看: 265

音频分离教程:分离人声与伴奏,用于制作切片去除背景音乐、伪合唱、歌切替换伴奏、完整歌曲拼凑等。

1.Adobe Audition中置声道提取

2.伴奏反相提取人声

3.采用AI算法的软件RX10

4.最强软件UVR5详解

1.用Adobe Audition的中置声道提取功能

该效果原理就是把音频左右声道完全一样的声音提取出来,人声正处于这个原理,所以后期制作时追求达到更好的人声质量,去除直播时附带的bgm,就可以用这方法

效果-立体声声像-中置声道提取器

低音人声通常代表男声,高音人声通常代表女声

一般歌曲或者直播内容中右边中心声道电平为人声,侧边声道电平为伴奏,当然也有部分特殊的

通过左下角绿色的开关按钮来预览效果,中心声道电平调到0~10dB之间,侧边声道电平调到-30~-45dB即可,新手其余参数可不调,觉得差不多了就可以应用效果了。

一时间捣鼓不懂可以在该窗口上方预设那里选择选择无伴奏合唱

在鉴别选项卡中还有更多参数可调,这方面内容确实较多就自己捣鼓学习吧!

在adobe官方文档中有对这些参数的说明:https://helpx.adobe.com/cn/audition/using/stereo-imagery-effects.html

当然Audition的中置声道提取效果其实并不好,在遇到音频某一频段缺失细节的情况,可以简单用FFT滤波器增加

首先点击多轨(或者右键新建),设置合适的采样率和位深度(通常选择和源文件相同的属性,B站hires规格则要求48000hz  24bit以上)

按住alt键,左键拖动要复制的音频到空白轨道,点选轨道,在效果组-音轨效果-点击三角形按钮-滤波与均衡-FFT滤波器

例:切掉200hz以上的频率,即复制了一条低频轨道,为歌曲增加了低频细节

导出多轨混音(B站hires支持FLAC、WAV、PCM等无损格式)

2.伴奏反相提取人声

如果有原版歌曲伴奏和混音成曲的话,这个提取出来的人声是最干净的,但是基本不适用于直播歌切的音频

au建立一个多轨道会话,把原曲和伴奏都拖进去放在两个轨道上,按住alt滚轮把峰值图拉大,如下:

放大到

将伴奏轨和原唱轨对齐,连峰值也要对齐

然后双击伴奏轨,在上方效果栏选择反相效果,然后回到多轨会话

一边播放调节伴奏轨道音量大小,当伴奏音量和原唱伴奏的音量大小一致的时候,剩下的就是清楚的人声了,然后原封不动导出多轨会话就行了,如果没用说明两轨还没完全对齐

3.RX10

iZotope RX10官网:https://www.izotope.com/en/products/rx.html

(网盘分享有中文版WIN修改版)https://pan.quark.cn/s/ab8ac0694c1e

RX10所有功能都是以插件的形式使用,同时也可以添加到其他软件中作为插件。

RX10也有中置声道提取的插件,和AU类似,基本通用。

RX10的也有中置声道提取的插件

另外还有基于算法的音乐再平衡插件,音频被分为人声、贝斯、打击乐和其他四类元素,通过降低其他三个混合元素的电平达到分离人声的效果。

其他插件也建议学习一下,修复杂音、口水音、降噪等等插件都非常好用,具体B站搜索RX10教程都有嗷!!!https://www.bilibili.com/video/BV1By4y1s77H/

4.最强软件UVR5详解(目前最好用)

开源地址:https://github.com/Anjok07/ultimatevocalremovergui

网盘也有分享可以下载

主界面其他选项:(选择不同算法有不同模型和选项)

GPU Conversion:勾选即可使用cuda加速(现在mac也可以勾选,如果不勾选的话,只用CPU处理会很慢)

Instrumental Only:只保存伴奏(instrumental)文件,即不保存人声文件

Vocals Only:只保存人声(Vocals)文件,即不保存伴奏文件

Sample Mode:试用模型,测试效果

Select saved settings:保存预设

(截图所使用的是mac版,版本号、win平台可能界面有些不同)

具体操作如下:

对新手来说按照下图这样操作就行,如果提取人声就在第四步后点击Save Vocals Only,想提取伴奏就点击Save Instrumental Only就好啦,二选一嗷!!!

在下平常提取人声算法选择的是VR Architecture的4_HP-Vocal-UVR.pth模型,提取伴奏常用MDx-Net的 UVR-MDX-NET-Main模型

在下电脑不好不敢飞,怕哪天整炸了数据全没了,有兴趣的可以自己多试试其他模型

进阶教程嗷,捣鼓熟悉了可以看下,没捣鼓懂的可以不看

初始模型+额外模型:

这款软件是将三个主流算法的模型集中使用的GUI版本,而三个算法在进行比赛又会经常更新模型,导致现在模型非常多。多就算了,还没有一个说明文档能查,所以下面的模型部分只能靠经验简单介绍一下了。

算法:可以选择不同的Al算法模型来处理音频。

• VR Architecture

这些模型使用幅度谱图进行信源分离(VR是索尼的AI算法)

• MDx-Net

这些模型使用混合频谱/波形进行源分离(处理高音质音频的AI算法,对人声的识别提取能力强大,就是慢一些)

• Demucs

这些模型使用混合频谱/波形进行源分离(Demucs是Facebook开源的声音分离模型,可以分离人声和乐器)

• Ensemble Mode (合奏模式)

用这个可以从多个算法模型中荻得最佳结果。

• Audio Tools:包含伸缩对齐等工具

在VR Architecture算法下:

Aggression Setting:

数值越大,清除人声的力度就越大,默认的10就可以,已经可以完全消除人声

较高的值执行更深的提取

乐器和声乐模型的默认值为 10

超过 10 的值可能会导致抽取伴奏的模型的结果中的乐器部分听起来浑浊

V5是新模型,V4模型可以忽略不使用了

1_HP-UVR.pth:非常强的伴奏提取模型(默认加载的模型,主要推荐)

2_HP-UVR.pth:基于1_HP-UVR.pth的微调模型

3_HP-Vocal-UVR.pth:用于人声提取,人声部分会很清晰,但伴奏部分可能会变得浑浊

4_HP-Vocal-UVR.pth:用于人声提取,但是比3_HP-Vocal-UVR.pth更加强势(Aggressive)

5_HP-Karokee-UVR.pth:保留和声的模型

6_HP-Karaoke-UVR.pth:作用同5_HP-Karokee-UVR.pth一样

7_HP2-UVR.pth:使用了更多的数据和新参数训练的超强伴奏提取模型

8_HP2-UVR.pth:超强伴奏提取模型(提取伴奏推荐)

9_HP-UVR.pth:基于8_HP2-UVR.pth微调的模型

10-16没有官方说明,应该是微调版本吧,V4是老模型

在MDx-Net算法下:

• Chunks(块)

这个选项允许用户减少(或增加)RAM 或 V-RAM 的使用

较小的块大小使用更少的 RAM 或 V-RAM,但也可能增加处理时间

较大的块大小使用更多的 RAM 或 V-RAM,但也可以减少处理时间

选择“Auto” 会根据你的系统有多少 RAM 或V-RAM 来计算一个合适的块大小

选择“Ful” 将把音频作为-

一个完整的块来处理

"Full” 选项只推荐给那些电脑性能比较强的人

默认选择是 “Auto”

同名不同编号的模型,是按照比赛中得分排序的。因此使用后缀1就好了

• UVR-MDX-NET Main  这是最强的模型之一,但占用的电脑资源也最多,通常情况下使用这个算法和这个模型就足够了

• UVR-MDX-NET 1   UVR-MDX-NET inst 1  可以试试看

• 下面的模型中带vocals字样的都是人声处理,可以用于提取人声(kuielab模型优势在于精准识别单一乐器或人声轨道)

在Demucs算法下:

• Choose Stem(s)(选择音轨)

你可以选择使用选定的模型提取哪个音轨

音轨的选择:

所有音轨一保存模型能够提取的所有音轨

人声一只提取人声音轨

其他- 只提取其它音轨

贝斯一只提取贝斯音轨

鼓-只提取鼓的音轨

• Segments (分块)

这个选项允许用户减少(或增加)RAM 或 V-RAM 的使用

较小的块大小使用更少的 RAM 或 V-RAM, 但也可能增加处理时间

较大的块大小使用更多的 RAM 或 V-RAM,但也可以减少处理时间

一般默认即可

htdemucs:第一个版本,默认模型。

htdemucs_ft:微调版本,分离将花费4倍的时间 但可能会好一点。与第一个版本相同的训练集。

htdemucs_6s:6 个轨道版本 。

hdemucs_mmi:混合 Demucs v3模型重新训练。

mdx:之前比赛里的第1名,最高质量的模型。

mdx_extra:使用额外的训练数据进行训练,比赛第2名。

mdx_extra_q :以前模型的量化版本。更小的下载和存储但质量可能会稍差一些。(速度快一些,电脑负载小)

V3其他模型都是微调

V1 V2是输出2轨的老模型,可以忽略

还有个合奏模式在下就不详细说了,对于平常的话这几个模型够用了(其实在下也还没整明白,怕误人子弟诸位见谅)具体的可以看这位“痕继痕迹”up主(BV1ga411S7gP)UVR5的介绍视频哈,简单且用心,推荐!

手动合奏移到设置的选项卡里面了

5.注意事项

这些也只是在下觉得比较实用的一些方法,在下也只是会点三脚猫功夫,希望能够帮到诸位学习,有错之处望诸位指出!!!

另外每一次处理都是对音频的损害,正常情况下是没办法做到完美分离出伴奏或者人声的,能做到的只能是更多的保留目标音频的细节,例如想为卡姐直播唱的歌换个伴奏,能做到也只能是在人声提取时尽可能的保存细节,目前是不可能达到完美分离的,完美主义者们可能失望了!!!

如果有办法请务必教导在下,阁下若能亲自指点,那必是感激不尽!!!

星律动周报素材(阿里云盘):大家有想要分享的文件可以发给我上传https://www.aliyundrive.com/s/az2yyNgyrmR 提取码:1234

PSD/软件分享(夸克网盘):https://pan.quark.cn/s/ab8ac0694c1e

星律动周报



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3