首页 > 解决方案 > Mel - 频谱图大小

问题描述

我正在使用 Python 中的 Librosa 从 GTZAN 数据集中提取 log Mel 频谱图。我的代码 -

data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)

嗯,它工作得很好。但是,每个梅尔谱图的大小是不同的。大多数 log Mel 谱图的大小为 2586,其中少数具有 2590 到 2620。

我在 Mel-spectrogram 上记录日志时检查了大小不同。记录日志时它们的大小有何不同是所有音频的长度相同...

任何建议,谢谢

标签: pythonneural-networksignal-processingvoice-recognitionlibrosa

解决方案


推荐阅读