首页 > 解决方案 > 从音频文件中删除人声的算法

问题描述

我知道这已经在10 多年前发布了,但我想相信这方面已经取得了一些进展。(我们现在有 Deepfake,在 AI 方面取得了很大进展)。

我大胆尝试了一些教程,但对结果感到非常失望(公平地说,结果输出并没有那么糟糕,但对于产品来说还不够好)。

我可以使用什么信誉良好的算法来处理自己的 mp3 文件并删除人声,同时保留鼓和居中的乐器,并消除人声回声?

标签: audioaudio-processing

解决方案


此任务在社区中称为“声源分离”或“人声信号分离”或“歌声源分离”,它们是专门的“音乐源分离”任务,也是更一般的“源分离”任务的示例。

这里有一些论文:音乐源分离。最积极开发的开源解决方案之一是Spleeter,它已在各种音频产品中商业化使用。有一个基于它的在线工具,你可以在Splitter.ai上试用。“2 stem”版本将为您提供一首带有人声的曲目,以及一首带有其他所有曲目的曲目。


推荐阅读