首页 > 解决方案 > 将完整的图像序列输入网络还是一次输入一帧?

问题描述

我目前正在尝试实施以下论文:https ://research.nvidia.com/sites/default/files/publications/dnn_denoise_author.pdf

我的数据具有以下形状:(7, 512, 512, 1),其中 7 是我序列中的帧数,512 是图像的宽度和高度,1 是通道数。

我的问题是:在训练期间,将完整的图像序列提供给卷积和 RNN 网络,还是一帧一帧地提供序列中的每一帧是否更好?

我已经尝试过第一种方法,但结果看起来不太好。因此,这是处理图像序列的“正确”方式,还是您有一些建议?

感谢您的时间!

标签: imagetensorflowsequenceconv-neural-networkrecurrent-neural-network

解决方案


在这里,作者在每个时间步发送一帧,这意味着,您将7推出LSTM,在每次推出时,它接受 1 帧。


推荐阅读