首页 > 解决方案 > tensorflow 占位符形状 [None] [None,1] 区别

问题描述

我是张量流的新手。我试验了一个 DQN 算法,其中的部分涉及

a = tf.placeholder(tf.int32, shape = [None],name='A')
q = tf.reduce_sum(critic_q * tf.one_hot(a,n_outputs),axis=1,keepdims=True,name='Q')#Q value for chosen action

y = tf.placeholder(tf.float32, shape = [None],name='Y')

learning_rate = 1e-4
cost = tf.reduce_mean(tf.square(y-q))#mean squared error
global_step = tf.Variable(0,trainable=False,name='global_step')
optimizer = tf.train.AdamOptimizer(learning_rate)
training_op = optimizer.minimize(cost,global_step=global_step)

并用 初始化输入 y y_batch=np.zeros(nbatch)。网络几乎没有经过任何训练。

然后,我切换到将 y 定义为

y = tf.placeholder(tf.float32, shape = [None,1],name='Y')

并用 初始化输入y_batch=np.zeros(nbatch).reshape(-1,1),效果很好。

第一次实施中发生了什么?

标签: pythontensorflow

解决方案


每个张量都有一个秩(维数)和一组维数。

具有形状[1]的占位符是等级为 1 且位置为 0 的维度为 1 的占位符。

具有形状[None, 1]的占位符是等级为 2 的占位符,因此它有 2 个维度。第一个维度(索引 0)具有未知大小(它将在运行时解析),而第二个维度(索引 1)具有已知大小 1。

为了兼容,张量必须具有相同的秩和维度。

您可以在此处阅读有关张量形状的更完整评估:https ://pgaleone.eu/tensorflow/2018/07/28/understanding-tensorflow-tensors-shape-static-dynamic/#tensors-the-basic


推荐阅读