machine-learning - 如何训练具有三个图像作为单个输入的模型
问题描述
我想训练 Inceptionv3 模型,我试图给出单个图像的 3 个不同视图并对其进行训练。所以我想在一个提要中提供三张图像作为我的输入。
用例:
我想预测鞋类的类型。在这个问题中,通常很多信息都存在不同的视图,所以只想尝试这种方法。
解决方案
我认为你有不同的行为方式:
- 删除第一层 inception 并创建您的以支持 3x3 尺寸。
- 对每个输入使用第一个 inception 块,然后将它们连接到某个 fc 层(或之前)。如果要搜索的功能相似,您可以使用共享参数。
第一种情况将合并所有维度并分散为任何图像提供的信息。第二个将提取每个图像中的特定特征。
推荐阅读
- python - ModuleNotFoundError:没有名为“_pywrap_tensorflow_internal”的模块。未能加载原生 TensorFlow 运行时
- javascript - 如何使用三元运算符使用 React 渲染 jsx?
- spring-boot - Spring Security 自定义 PermissionEvaluator
- javascript - 根据反应编辑机器人的消息
- javascript - 如何使用 underscore.js 在列表元素中过滤具有匹配参数的对象?
- github - Github 存储库文件访问
- python - discord.py bot 正确构建在 heroku 上,但显示脱机
- arrays - SWIFT:我无法解析来自 URL 的数据?
- swiftui - 参数 SwiftUI 中的可选绑定
- reactjs - 在reactjs中使用令牌登录时检查用户是否登录的最佳方法是什么