首页 > 解决方案 > 从 .wav 文件中提取特征/标签到 .csv

问题描述

我需要从 .wav 文件(音频样本)到 .csv 文件中提取诸如持续时间、平均频率、sd、中位数等特征。

我已经完成了代码,但我无法获得我需要的所有功能。我想要的功能是:

"meanfreq", "sd", "median", "Q25", "Q75", "IQR", "skew", "kurt", "sp.ent", "sfm", "mode", "centroid", "meanfun", "minfun", "maxfun", "meandom", "mindom", "maxdom", "dfrange", "modindx", "label"

我设法提取的特征是:

'nobs', 'mean', 'skew', 'kurtosis', 'median', 'mode', 'std', 'low', 'peak', 'q25', 'q75', 'iqr', 'label'

这是我已经完成的功能(注意:这只是我的功能代码的一小部分,我还有更多):

def get_features(frequencies):  # acoustic attributes
    print("\nExtracting features ")
    nobs, minmax, mean, variance, skew, kurtosis = 
    stats.describe(frequencies)
    median = np.median(frequencies)
    mode = stats.mode(frequencies).mode[0]
    std = np.std(frequencies)
    low, peak = minmax
    q75, q25 = np.percentile(frequencies, [75, 25])
    iqr = q75 - q25
    return (nobs, mean, skew, kurtosis, median, mode, std, low, peak, q25, q75, iqr)

我也知道互联网上有现有的 voice.csv 数据集,但我想要将它们从 .wav 转换为 .csv 并能够自己提取特征而不是使用预处理的 .csv 文件的代码。

提前非常感谢你:)

标签: pythonpython-3.xnumpydataframevoice-recognition

解决方案


推荐阅读