image - 将完整的图像序列输入网络还是一次输入一帧？

我的数据具有以下形状：(7, 512, 512, 1)，其中 7 是我序列中的帧数，512 是图像的宽度和高度，1 是通道数。

我的问题是：在训练期间，将完整的图像序列提供给卷积和 RNN 网络，还是一帧一帧地提供序列中的每一帧是否更好？

我已经尝试过第一种方法，但结果看起来不太好。因此，这是处理图像序列的“正确”方式，还是您有一些建议？

感谢您的时间！

标签： imagetensorflowsequenceconv-neural-networkrecurrent-neural-network

在这里，作者在每个时间步发送一帧，这意味着，您将7推出LSTM，在每次推出时，它接受 1 帧。