首页 > 解决方案 > 如何使用 CNN 输出图像?

问题描述

我正在尝试使用 CNN 进行深度估计(这是我的最终目标),但我发现的一个问题是:我刚刚使用 CNN 进行了图像分类,例如使用“CIFAR-10”、“MNIST”、“Cats vs Dogs”等。要进行深度估计,我需要输出一个新图像(NYUv2 数据集具有标记图像)。所以,我将输入一个像 256x256x3 这样的图像,并且需要输出另一个图像,例如 228x228x3。

我需要做什么?我可以只做一段时间的卷积,然后减少特征图并增加维度吗?谢谢

obs:我正在使用 Tensorflow 2.0

标签: pythontensorflowkerasdeep-learningconv-neural-network

解决方案


我建议你使用一种UNet。这种架构具有下采样层,然后是上采样层以返回原始空间维度。


推荐阅读