python - 如何将两个音频样本压缩成与 librosa 一样响亮?
问题描述
我正在尝试使两个音频样本尽可能相似,我的问题是在一个测试用例中它们的响度不够相似。
data1, sr1 = librosa.load(path_1, sr=None)
data2, sr2 = librosa.load(path_2, sr=None)
这是我的图data1
和data2
随着时间的推移(s) - 你可以看到data1
一开始有点安静:
我以为我只需要标准化它,但后来我意识到 librosa 已经在这样做了。
所以问题似乎是,较安静的部分比 in更响亮。
load
data2
data1
这对我来说听起来像是一种压缩,所以我尝试压缩data1
:
data1, sr1 = librosa.load(path_1, sr=None)
data1 = librosa.mu_compress(data1, quantize=False)
data2, sr2 = librosa.load(path_2, sr=None)
不幸的是,现在data1
安静的部分太大声了。所以我也尝试压缩data2:
data1, sr1 = librosa.load(path_1, sr=None)
data1 = librosa.mu_compress(data1, quantize=False)
data2, sr2 = librosa.load(path_2, sr=None)
data2 = librosa.mu_compress(data2, quantize=False)
但后来我又回到了我开始的地方......
我希望我把我的问题说清楚了;)
如何以“智能方式”压缩声音,使它们最终尽可能相似?
解决方案
推荐阅读
- javascript - ASP.NET Core 3.0:加载 GIF
- angular - Angular datePicker ngx-translate
- postgresql - PostgreSQL 触发器,用于在 table1 中插入一行后在 table2 中插入一个条目(使用 table1 中新插入行的值)
- javascript - 无法让 glidejs 使用 pug 模板
- javascript - 将通用 React 组件转换为 TypeScript 会引发错误
- java - 如何在错误 Spring WebFlux 上调用另一个 api
- vega-lite - 如何使用 Vega-lite ObservableHQ 添加简单的点击事件?
- excel - 用于输出 TSV 的 Excel VBA 脚本给出了前导和尾随双引号,我该如何删除它们
- javascript - 如何在 mapbox 中禁用事件监听器?
- c++ - 如何在VS2019 CUDA项目中启用C++17代码生成