首页 > 解决方案 > 我们如何在实施 AI 模型中处理真实值和频谱特征

问题描述

我正在处理音频分类任务。

我只是标记每个声音并将其保存在文件夹中。通过使用 librosa 库,我能够将其转换为频谱,然后使用我进行训练的 fastai resnet 模型。准确率大约为 70% 到 75%。我们如何提高准确性?我想到的一件事是,如果我将角度和距离等特征与音频信号一起使用,我可以提高准确性。但是问题来了,如果我将角度、距离特征和音频信号结合在一起,我该如何处理数据。由于音频信号必须转换为频谱,即图像和距离,角度是实际值。我应该使用哪种型号?您能否指导我如何使用这些不同的功能(实际值和频谱)非常感谢您的帮助。

标签: pythonsignal-processing

解决方案


推荐阅读