首页 > 解决方案 > Keras 中的 RGB 图像是表示为 [R,G,B], [R,G,B], ... 还是表示为 [RR.., GG.., BB..]?

问题描述

假设我们有一个 3x3 RGB 图像。

以下哪种表述是正确的?

[ R, G, B],               [ R, R, R],
[ R, G, B],     OR        [ G, G, G], 
[ R, G, B]                [ B, B, B]

我故意省略了外括号,因为它们的设置方式是我的问题的一部分

标签: machine-learningkerasdeep-learningcomputer-visionrgb

解决方案


在 Keras(和大多数其他地方)中,“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每一行是一个像素数组,每个像素是一个由 3 个颜色/通道组成的数组。要回答您的确切问题,您的第一个示例而不是您的第二个示例最能代表这一点。

但是,Keras 也可以配置为使用channels_first,这意味着它是相反的。在这种情况下,图像是 3 个通道的阵列,每个通道是一个单色 2D 像素阵列。


推荐阅读