真黎葡也能心满意足的【音频分离教程】

您所在的位置：网站首页 › 自制反相器 › 真黎葡也能心满意足的【音频分离教程】

真黎葡也能心满意足的【音频分离教程】

#真黎葡也能心满意足的【音频分离教程】| 来源: 网络整理| 查看: 265

音频分离教程：分离人声与伴奏，用于制作切片去除背景音乐、伪合唱、歌切替换伴奏、完整歌曲拼凑等。

1.Adobe Audition中置声道提取

2.伴奏反相提取人声

3.采用AI算法的软件RX10

4.最强软件UVR5详解

1.用Adobe Audition的中置声道提取功能

该效果原理就是把音频左右声道完全一样的声音提取出来，人声正处于这个原理，所以后期制作时追求达到更好的人声质量，去除直播时附带的bgm，就可以用这方法

效果-立体声声像-中置声道提取器

低音人声通常代表男声，高音人声通常代表女声

一般歌曲或者直播内容中右边中心声道电平为人声，侧边声道电平为伴奏，当然也有部分特殊的

通过左下角绿色的开关按钮来预览效果，中心声道电平调到0~10dB之间，侧边声道电平调到-30~-45dB即可，新手其余参数可不调，觉得差不多了就可以应用效果了。

一时间捣鼓不懂可以在该窗口上方预设那里选择选择无伴奏合唱

在鉴别选项卡中还有更多参数可调，这方面内容确实较多就自己捣鼓学习吧！

在adobe官方文档中有对这些参数的说明：https://helpx.adobe.com/cn/audition/using/stereo-imagery-effects.html

当然Audition的中置声道提取效果其实并不好，在遇到音频某一频段缺失细节的情况，可以简单用FFT滤波器增加

首先点击多轨（或者右键新建），设置合适的采样率和位深度（通常选择和源文件相同的属性，B站hires规格则要求48000hz 24bit以上）

按住alt键，左键拖动要复制的音频到空白轨道，点选轨道，在效果组-音轨效果-点击三角形按钮-滤波与均衡-FFT滤波器

例：切掉200hz以上的频率，即复制了一条低频轨道，为歌曲增加了低频细节

导出多轨混音（B站hires支持FLAC、WAV、PCM等无损格式）

2.伴奏反相提取人声

如果有原版歌曲伴奏和混音成曲的话，这个提取出来的人声是最干净的，但是基本不适用于直播歌切的音频

au建立一个多轨道会话，把原曲和伴奏都拖进去放在两个轨道上，按住alt滚轮把峰值图拉大，如下：

放大到

将伴奏轨和原唱轨对齐，连峰值也要对齐

然后双击伴奏轨，在上方效果栏选择反相效果，然后回到多轨会话

一边播放调节伴奏轨道音量大小，当伴奏音量和原唱伴奏的音量大小一致的时候，剩下的就是清楚的人声了，然后原封不动导出多轨会话就行了，如果没用说明两轨还没完全对齐

3.RX10

iZotope RX10官网：https://www.izotope.com/en/products/rx.html

（网盘分享有中文版WIN修改版）https://pan.quark.cn/s/ab8ac0694c1e

RX10所有功能都是以插件的形式使用，同时也可以添加到其他软件中作为插件。

RX10也有中置声道提取的插件，和AU类似，基本通用。

RX10的也有中置声道提取的插件

另外还有基于算法的音乐再平衡插件，音频被分为人声、贝斯、打击乐和其他四类元素，通过降低其他三个混合元素的电平达到分离人声的效果。

其他插件也建议学习一下，修复杂音、口水音、降噪等等插件都非常好用，具体B站搜索RX10教程都有嗷！！！https://www.bilibili.com/video/BV1By4y1s77H/

4.最强软件UVR5详解（目前最好用）

开源地址：https://github.com/Anjok07/ultimatevocalremovergui

网盘也有分享可以下载

主界面其他选项：（选择不同算法有不同模型和选项）

GPU Conversion：勾选即可使用cuda加速（现在mac也可以勾选，如果不勾选的话，只用CPU处理会很慢）

Instrumental Only：只保存伴奏（instrumental）文件，即不保存人声文件

Vocals Only：只保存人声（Vocals）文件，即不保存伴奏文件

Sample Mode：试用模型，测试效果

Select saved settings：保存预设

（截图所使用的是mac版，版本号、win平台可能界面有些不同）

具体操作如下：

对新手来说按照下图这样操作就行，如果提取人声就在第四步后点击Save Vocals Only，想提取伴奏就点击Save Instrumental Only就好啦，二选一嗷！！！

在下平常提取人声算法选择的是VR Architecture的4_HP-Vocal-UVR.pth模型，提取伴奏常用MDx-Net的 UVR-MDX-NET-Main模型

在下电脑不好不敢飞，怕哪天整炸了数据全没了，有兴趣的可以自己多试试其他模型

进阶教程嗷，捣鼓熟悉了可以看下，没捣鼓懂的可以不看

初始模型+额外模型：

这款软件是将三个主流算法的模型集中使用的GUI版本，而三个算法在进行比赛又会经常更新模型，导致现在模型非常多。多就算了，还没有一个说明文档能查，所以下面的模型部分只能靠经验简单介绍一下了。

算法：可以选择不同的Al算法模型来处理音频。

• VR Architecture

这些模型使用幅度谱图进行信源分离（VR是索尼的AI算法）

• MDx-Net

这些模型使用混合频谱/波形进行源分离（处理高音质音频的AI算法，对人声的识别提取能力强大，就是慢一些）

• Demucs

这些模型使用混合频谱/波形进行源分离（Demucs是Facebook开源的声音分离模型，可以分离人声和乐器）

• Ensemble Mode （合奏模式）

用这个可以从多个算法模型中荻得最佳结果。

• Audio Tools：包含伸缩对齐等工具

在VR Architecture算法下：

Aggression Setting：

数值越大，清除人声的力度就越大，默认的10就可以，已经可以完全消除人声

较高的值执行更深的提取

乐器和声乐模型的默认值为 10

超过 10 的值可能会导致抽取伴奏的模型的结果中的乐器部分听起来浑浊

V5是新模型，V4模型可以忽略不使用了

1_HP-UVR.pth：非常强的伴奏提取模型（默认加载的模型，主要推荐）

2_HP-UVR.pth：基于1_HP-UVR.pth的微调模型

3_HP-Vocal-UVR.pth：用于人声提取，人声部分会很清晰，但伴奏部分可能会变得浑浊

4_HP-Vocal-UVR.pth：用于人声提取，但是比3_HP-Vocal-UVR.pth更加强势（Aggressive）

5_HP-Karokee-UVR.pth：保留和声的模型

6_HP-Karaoke-UVR.pth：作用同5_HP-Karokee-UVR.pth一样

7_HP2-UVR.pth：使用了更多的数据和新参数训练的超强伴奏提取模型

8_HP2-UVR.pth：超强伴奏提取模型（提取伴奏推荐）

9_HP-UVR.pth：基于8_HP2-UVR.pth微调的模型

10-16没有官方说明，应该是微调版本吧，V4是老模型

在MDx-Net算法下：

• Chunks（块）

这个选项允许用户减少（或增加）RAM 或 V-RAM 的使用

较小的块大小使用更少的 RAM 或 V-RAM，但也可能增加处理时间

较大的块大小使用更多的 RAM 或 V-RAM，但也可以减少处理时间

选择“Auto” 会根据你的系统有多少 RAM 或V-RAM 来计算一个合适的块大小

选择“Ful” 将把音频作为-

一个完整的块来处理

"Full” 选项只推荐给那些电脑性能比较强的人

默认选择是 “Auto”

同名不同编号的模型，是按照比赛中得分排序的。因此使用后缀1就好了

• UVR-MDX-NET Main 这是最强的模型之一，但占用的电脑资源也最多，通常情况下使用这个算法和这个模型就足够了

• UVR-MDX-NET 1 UVR-MDX-NET inst 1 可以试试看

• 下面的模型中带vocals字样的都是人声处理，可以用于提取人声（kuielab模型优势在于精准识别单一乐器或人声轨道）

在Demucs算法下：

• Choose Stem(s)（选择音轨）

你可以选择使用选定的模型提取哪个音轨

音轨的选择：

所有音轨一保存模型能够提取的所有音轨

人声一只提取人声音轨

其他- 只提取其它音轨

贝斯一只提取贝斯音轨

鼓-只提取鼓的音轨

• Segments （分块）

这个选项允许用户减少（或增加）RAM 或 V-RAM 的使用

较小的块大小使用更少的 RAM 或 V-RAM，但也可能增加处理时间

较大的块大小使用更多的 RAM 或 V-RAM，但也可以减少处理时间

一般默认即可

htdemucs：第一个版本，默认模型。

htdemucs_ft：微调版本，分离将花费4倍的时间但可能会好一点。与第一个版本相同的训练集。

htdemucs_6s：6 个轨道版本。

hdemucs_mmi：混合 Demucs v3模型重新训练。

mdx：之前比赛里的第1名，最高质量的模型。

mdx_extra：使用额外的训练数据进行训练，比赛第2名。

mdx_extra_q ：以前模型的量化版本。更小的下载和存储但质量可能会稍差一些。（速度快一些，电脑负载小）

V3其他模型都是微调

V1 V2是输出2轨的老模型，可以忽略

还有个合奏模式在下就不详细说了，对于平常的话这几个模型够用了（其实在下也还没整明白，怕误人子弟诸位见谅）具体的可以看这位“痕继痕迹”up主（BV1ga411S7gP）UVR5的介绍视频哈，简单且用心，推荐！

手动合奏移到设置的选项卡里面了

5.注意事项

这些也只是在下觉得比较实用的一些方法，在下也只是会点三脚猫功夫，希望能够帮到诸位学习，有错之处望诸位指出！！！

另外每一次处理都是对音频的损害，正常情况下是没办法做到完美分离出伴奏或者人声的，能做到的只能是更多的保留目标音频的细节，例如想为卡姐直播唱的歌换个伴奏，能做到也只能是在人声提取时尽可能的保存细节，目前是不可能达到完美分离的，完美主义者们可能失望了！！！

如果有办法请务必教导在下，阁下若能亲自指点，那必是感激不尽！！！

星律动周报素材（阿里云盘）：大家有想要分享的文件可以发给我上传https://www.aliyundrive.com/s/az2yyNgyrmR 提取码：1234

PSD/软件分享（夸克网盘）：https://pan.quark.cn/s/ab8ac0694c1e

星律动周报

【本文地址】

真黎葡也能心满意足的【音频分离教程】

真黎葡也能心满意足的【音频分离教程】

今日新闻

推荐新闻