python - Mel - 频谱图大小
问题描述
我正在使用 Python 中的 Librosa 从 GTZAN 数据集中提取 log Mel 频谱图。我的代码 -
data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)
嗯,它工作得很好。但是,每个梅尔谱图的大小是不同的。大多数 log Mel 谱图的大小为 2586,其中少数具有 2590 到 2620。
我在 Mel-spectrogram 上记录日志时检查了大小不同。记录日志时它们的大小有何不同是所有音频的长度相同...
任何建议,谢谢
解决方案
推荐阅读
- c++ - 如何将顶点着色器转换的结果数据返回到 CPU?
- javascript - 文件数据在发送到服务器时显示为空对象,但在通过 axios api 发送之前包含数据
- python - 如何对平面列表中表示的分层数据进行排序?
- php - 尝试通过 heroku 中的 supervisord 运行 apache 遇到 chown 问题
- clojure - 如何在 Clojure 中指定没有参数的函数?
- python - 处理 websockets 模块异常和错误
- vue.js - 如何使用 $emit 或 vuex 从组件向主实例发出事件
- python - 如何使用 python 脚本读取/翻译 *txt.erb 模板(ruby)
- c++ - 如何在使用 Visual Studio 2019 的 cmake 项目中使用库(dll/lib)
- python - 代码工作正常,但是当整个代码放在 def() 函数中时,不能完全工作