machine-learning - Keras 中的 RGB 图像是表示为 [R,G,B], [R,G,B], ... 还是表示为 [RR.., GG.., BB..]?
问题描述
假设我们有一个 3x3 RGB 图像。
以下哪种表述是正确的?
[ R, G, B], [ R, R, R],
[ R, G, B], OR [ G, G, G],
[ R, G, B] [ B, B, B]
我故意省略了外括号,因为它们的设置方式是我的问题的一部分
解决方案
在 Keras(和大多数其他地方)中,“R”、“G”和“B”被称为“通道”。默认情况下,通道是张量的最后一个维度。这意味着每个图像是一个行数组,每一行是一个像素数组,每个像素是一个由 3 个颜色/通道组成的数组。要回答您的确切问题,您的第一个示例而不是您的第二个示例最能代表这一点。
但是,Keras 也可以配置为使用channels_first
,这意味着它是相反的。在这种情况下,图像是 3 个通道的阵列,每个通道是一个单色 2D 像素阵列。
推荐阅读
- c++ - 具有重复编译标志的 CMake 生成器表达式
- python - 如何编写python代码来使用blockdiag包
- c# - 如何在列表c#中识别不匹配的值
- mongodb - Apache 反向代理 MongoDB
- google-cloud-platform - OHIF 查看器始终要求 Google 身份验证
- react-native - React Native 视频全屏
- python - 网页抓取:请求错误 - ('Connection aborted.', OSError(0, 'Error'))
- powershell - 连接到远程服务器 api.interfaces.records.teams.microsoft.com 失败并显示以下错误消息
- python - 对 2 个不同的视图集使用相同的路线,一个用于写作,一个用于阅读
- node.js - 从 Node.js 连接到 Azure SQL 数据库时没有任何反应