首页 > 解决方案 > Vggish 参数设置:如何将 log-mel 频谱图设为任意频率?

问题描述

您好,这是我第一次在 stackoverflow 中提问 :)

我有一个一般问题和几个具体问题。后者在详细信息之后提供。

我的目标:

我的一般问题:

一些细节:

# Hyperparameters used in feature and example generation.
SAMPLE_RATE = 16000
STFT_WINDOW_LENGTH_SECONDS = 0.025
STFT_HOP_LENGTH_SECONDS = 0.010
NUM_MEL_BINS = NUM_BANDS
MEL_MIN_HZ = 125
MEL_MAX_HZ = 7500
LOG_OFFSET = 0.01  # Offset used for stabilized log of input mel-spectrogram.
EXAMPLE_WINDOW_SECONDS = 0.96  # Each example contains 96 10ms frames
EXAMPLE_HOP_SECONDS = 0.96     # with zero overlap.

更多附带问题:

感谢您宝贵的时间!!

标签: tensorflowdeep-learningsignal-processingaudio-processing

解决方案


推荐阅读