首页 > 解决方案 > 如何训练具有三个图像作为单个输入的模型

问题描述

我想训练 Inceptionv3 模型,我试图给出单个图像的 3 个不同视图并对其进行训练。所以我想在一个提要中提供三张图像作为我的输入。

用例:

我想预测鞋类的类型。在这个问题中,通常很多信息都存在不同的视图,所以只想尝试这种方法。

标签: machine-learningdeep-learningdata-sciencetransfer-learning

解决方案


我认为你有不同的行为方式:

  • 删除第一层 inception 并创建您的以支持 3x3 尺寸。
  • 对每个输入使用第一个 inception 块,然后将它们连接到某个 fc 层(或之前)。如果要搜索的功能相似,您可以使用共享参数。

第一种情况将合并所有维度并分散为任何图像提供的信息。第二个将提取每个图像中的特定特征。


推荐阅读