首页 > 解决方案 > slim.conv3d 中的参数是什么?

问题描述

这是 3D CNN 中的一个层的代码,我的输入是视频帧。我很难理解参数的含义。

net = slim.conv3d(net, 64, [1, 3, 3], scope='conv32')

net = PReLU(net, 'conv32_activation')

net = tf.nn.max_pool3d(net, strides=[1, 1, 2, 2, 1], ksize=[1, 1, 3, 3, 1], padding='VALID', name='pool3')

[1,3,3] 是指我的过滤器大小吗?ksize 中的 5 个数字是什么?

标签: pythontensorflowconv-neural-network

解决方案


欢迎来到 SO。

这里你使用的是 Conv3D,有很多参数,你可以在这里看到它们 conv3dmaxpool3d

是的,[1,3,3] 是指您的过滤器大小。
ksize 是窗口的大小,本质上是您在使用 maxpool 时要考虑的尺寸。

是一个很棒的 CNN 指南,所有内容都得到了解释。


推荐阅读