首页 > 解决方案 > 如何将两个音频样本压缩成与 librosa 一样响亮?

问题描述

我正在尝试使两个音频样本尽可能相似,我的问题是在一个测试用例中它们的响度不够相似。

data1, sr1 = librosa.load(path_1, sr=None)
data2, sr2 = librosa.load(path_2, sr=None) 

这是我的图data1data2随着时间的推移(s) - 你可以看到data1一开始有点安静: 我以为我只需要标准化它,但后来我意识到 librosa 已经在这样做了。 所以问题似乎是,较安静的部分比 in更响亮。
原来的
load
data2data1

这对我来说听起来像是一种压缩,所以我尝试压缩data1

 data1, sr1 = librosa.load(path_1, sr=None)
 data1 = librosa.mu_compress(data1, quantize=False)
 data2, sr2 = librosa.load(path_2, sr=None)

压缩数据1

不幸的是,现在data1安静的部分太大声了。所以我也尝试压缩data2:

data1, sr1 = librosa.load(path_1, sr=None)
data1 = librosa.mu_compress(data1, quantize=False)
data2, sr2 = librosa.load(path_2, sr=None)
data2 = librosa.mu_compress(data2, quantize=False)

都压缩了
但后来我又回到了我开始的地方......
我希望我把我的问题说清楚了;)

如何以“智能方式”压缩声音,使它们最终尽可能相似?

标签: pythonlibrosa

解决方案


推荐阅读