python - 深度学习算法的平均输出
问题描述
我正在尝试对一些音频剪辑进行分类,为此我必须将每个 30 秒长的音频剪辑拆分为 1 秒剪辑。然后我想把这个 1 秒的音频剪辑放在一个分类器中,并对所有 30 个一秒的音频文件的输出进行平均,以获得我的最终响应。我希望每 30 个输入有 1 个输出。
我的问题是我不知道如何在我的分类器中输入它们,我不能按照这里的建议使用多个输入,因为我有 30 个输入,而不仅仅是 2 个,这将是一团糟。
解决方案
您提到的链接是关于拥有 2 个单独的输入管道而不是 2 个输入音频剪辑。您需要将30 个一秒的音频数据包装在一个Tensor
(如果您使用的是 Tensorflow,如果没有,则使用您正在使用的框架的等效项)
然后Tensor
可以将其输入到您的深度学习模型的一个输入管道中。
查看在 Tensoflow 中处理音频数据的教程: Tensorflow Audio Data Preparation and Augmentation Tutorial
推荐阅读
- mirroring - 多台 PC 的 VGA 输出在具有切换功能的多台显示器上镜像
- json - 允许用户在有限制的情况下启动 EC2 的 IAM 策略
- flutter - 如何在颤动中更改 AppBar 标题(在图像资产和文本之间)?
- python - Python/Sympy 找到矩阵不是身份的特征值
- python - 如何使用(self)解决构建模型的问题
- azure - 在 Azure DevOps wiki 中嵌入 asciidoc
- python - 更新绘图时出错 + 如何改善其外观
- javascript - 可以随时暂停的音频
- vba - 对于每个...下一个不循环
- google-chrome - HTTP/2 流 1 未完全关闭:PROTOCOL_ERROR