image - 将完整的图像序列输入网络还是一次输入一帧?
问题描述
我目前正在尝试实施以下论文:https ://research.nvidia.com/sites/default/files/publications/dnn_denoise_author.pdf
我的数据具有以下形状:(7, 512, 512, 1),其中 7 是我序列中的帧数,512 是图像的宽度和高度,1 是通道数。
我的问题是:在训练期间,将完整的图像序列提供给卷积和 RNN 网络,还是一帧一帧地提供序列中的每一帧是否更好?
我已经尝试过第一种方法,但结果看起来不太好。因此,这是处理图像序列的“正确”方式,还是您有一些建议?
感谢您的时间!
解决方案
在这里,作者在每个时间步发送一帧,这意味着,您将7
推出LSTM
,在每次推出时,它接受 1 帧。
推荐阅读
- python - Python正则表达式域名
- vue.js - axios Post 根据请求给出 net::ERR_UNEXPECTED_PROXY_AUTH 错误
- sql - 在日期死亡后查找第一笔交易
- javascript - 无法在 jQuery 的 ajax 成功中分配或访问当前选择框值
- css - 相同的 CSS 在具有 Chrome 的两台 PC 上具有不同的行为
- python - 在 sqlite3 中减少读取数据库冗余的功能
- javascript - 根据包括键名在内的值进行排序
- apache-spark - 有条件的 PySpark 窗口
- arrays - 在 Swift 中通过多个关键字过滤对象
- python - tensorflow:InvalidArgumentError 同时找到 AUC 分数