首页 > 解决方案 > 深度学习算法的平均输出

问题描述

我正在尝试对一些音频剪辑进行分类,为此我必须将每个 30 秒长的音频剪辑拆分为 1 秒剪辑。然后我想把这个 1 秒的音频剪辑放在一个分类器中,并对所有 30 个一秒的音频文件的输出进行平均,以获得我的最终响应。我希望每 30 个输入有 1 个输出。

我的问题是我不知道如何在我的分类器中输入它们,我不能按照这里的建议使用多个输入,因为我有 30 个输入,而不仅仅是 2 个,这将是一团糟。

标签: pythontensorflowkerasdeep-learningclassification

解决方案


您提到的链接是关于拥有 2 个单独的输入管道而不是 2 个输入音频剪辑。您需要将30 个一秒的音频数据包装在一个Tensor(如果您使用的是 Tensorflow,如果没有,则使用您正在使用的框架的等效项)

然后Tensor可以将其输入到您的深度学习模型的一个输入管道中。

查看在 Tensoflow 中处理音频数据的教程: Tensorflow Audio Data Preparation and Augmentation Tutorial


推荐阅读