首页 > 解决方案 > 什么 ImagePairData 层在 Caffe 中意味着什么?

问题描述

我有一个 Caffe .prototxt 文件,我想在 Keras 或 TensorFlow 中转换 Caffe 层。有一种层类型:“ImagePairData”,我不明白这是什么意思,它对 Keras 或 TensorFlow 的转换是什么?这是图层:

layer {
  name: "pairdata"
  type: "ImagePairData"
  top: "data"
  top: "label"
  image_pair_data_param {
    image_dir: "benchmark_val/train/images"
    label_dir: "benchmark_val/train/gt"
    batch_size: 10
    h_img: 256
    w_img: 256
    h_map: 256
    w_map: 256
    channels: 3
    mean: 0
    scale: 1
    multiclass: false
  }

  include: {phase: TRAIN}
}

在 Keras 或 TensorFlow 中有什么层与该层相似?

标签: tensorflowkerasdeep-learningcaffecaffe2

解决方案


该层不是 caffe 的“基本”层的一部分(caffe 是“附带”的层,请参阅此处的 caffe 层列表)。它可能是您尝试从中获取此模型的任何人编写的自定义层。

如果不看代码,我无法确切告诉您该层的作用,但我的猜测是该层为网络提供了两个输入:
1 "data". 大小为 10-3-256-256 (batch_size: 10channels: 3) h_img, w_img: 2562.
大小"label"为 10- 1-256-256(因为multiclass: false我假设这里只有一个“频道”)

我想这个层是分割/像素标记任务的输入层,提供"data"相同空间大小的输入()和参考地面实况("label")。

我认为您应该在 Keras/TensorFlow 中编写自己的输入层以具有类似的功能。


推荐阅读