audio - 从音频文件中删除人声的算法
问题描述
我知道这已经在10 多年前发布了,但我想相信这方面已经取得了一些进展。(我们现在有 Deepfake,在 AI 方面取得了很大进展)。
我大胆尝试了一些教程,但对结果感到非常失望(公平地说,结果输出并没有那么糟糕,但对于产品来说还不够好)。
我可以使用什么信誉良好的算法来处理自己的 mp3 文件并删除人声,同时保留鼓和居中的乐器,并消除人声回声?
解决方案
此任务在社区中称为“声源分离”或“人声信号分离”或“歌声源分离”,它们是专门的“音乐源分离”任务,也是更一般的“源分离”任务的示例。
这里有一些论文:音乐源分离。最积极开发的开源解决方案之一是Spleeter,它已在各种音频产品中商业化使用。有一个基于它的在线工具,你可以在Splitter.ai上试用。“2 stem”版本将为您提供一首带有人声的曲目,以及一首带有其他所有曲目的曲目。
推荐阅读
- java - Multiple value key not adding, only remplacing in json file
- docker - Error building new workspace using docker-compose when running "apt-get update -yqq"
- mysql - MySQL atomic library missing error during MyChem installation using cmake
- java - Understanding the sort part of Java Merge sort
- c# - OracleDataReader Exception when Select a Blob type Column
- javascript - Onclick不显示表单反应
- java - Avro Java 特定的数据读取器是否可重用?
- forms - 根据从组合框中选择的条目在 Access 表单中创建条目(不包括来自组合框的条目)
- c# - 将 ASP.NET Core 身份验证中间件配置为在 Authorization 标头无效时始终返回 401
- postgresql - Ecto 与旧版数据库中的 bigint 与整数错误