python - 我们如何在实施 AI 模型中处理真实值和频谱特征
问题描述
我正在处理音频分类任务。
我只是标记每个声音并将其保存在文件夹中。通过使用 librosa 库,我能够将其转换为频谱,然后使用我进行训练的 fastai resnet 模型。准确率大约为 70% 到 75%。我们如何提高准确性?我想到的一件事是,如果我将角度和距离等特征与音频信号一起使用,我可以提高准确性。但是问题来了,如果我将角度、距离特征和音频信号结合在一起,我该如何处理数据。由于音频信号必须转换为频谱,即图像和距离,角度是实际值。我应该使用哪种型号?您能否指导我如何使用这些不同的功能(实际值和频谱)非常感谢您的帮助。
解决方案
推荐阅读
- google-apps-script - 将每行中的值从一个单元格复制到另一个单元格,作为 Google 工作表中的“值”
- python - 如何将具有相同缺失列的列与熊猫合并
- javascript - 使用 Formik 编辑条目,Yup 无法识别现有字段
- javascript - 如何在 yaml 脚本中获取 curl 响应 JSON?
- java - 使用 Jackson 库创建 JSON 反斜杠 + 斜杠
- c# - How to make PATH inside Region clickable in UWP
- azure - 权限被拒绝异常 Azure CLI
- c# - 线程循环的异步基础
- scala - 将键从多级 Hashmap 收集到 Scala 中的有序 ListBuffer
- android - 当应用程序处于 LockTask(KIOSK 模式)时,媒体播放器不播放任何音频