python - 在 Tensorflow 中输入占位符时使用哪些值?
问题描述
在下面的代码中,有许多张量操作和计算。我想看看其中一些计算的结果,以便更好地理解它们。具体来说,我想看看在使用print(Session.Run(h))
. 但是,计算取决于占位符 X。因此,为了查看它们,我需要使用提要字典。
我已经通读了这个 SO 问题:如何提供占位符?和其他几个。我仍然不知道我应该在这个占位符中输入什么。
要查看 h 的值,在尝试打印时我应该如何或者更确切地说应该将什么放入 feed 字典?
def expand_tile(value, size):
"""Add a new axis of given size."""
value = tf.convert_to_tensor(value, name='value')
ndims = value.shape.ndims
return tf.tile(tf.expand_dims(value, axis=0), [size] + [1]*ndims)
def positions_for(tokens, past_length):
batch_size = tf.shape(tokens)[0]
nsteps = tf.shape(tokens)[1]
return expand_tile(past_length + tf.range(nsteps), batch_size)
def model(hparams, X, past=None, scope='model', reuse=tf.AUTO_REUSE):
with tf.variable_scope(scope, reuse=reuse):
results = {}
batch_size = 1
X = tf.placeholder(tf.int32, [batch_size, None])
batch, sequence = shape_list(X)
wpe = tf.get_variable('wpe', [1024, 768],
initializer=tf.random_normal_initializer(stddev=0.01))
wte = tf.get_variable('wte', [50256, 768],
initializer=tf.random_normal_initializer(stddev=0.02))
past_length = 0 if past is None else tf.shape(past)[-2]
h = tf.gather(wte, X) + tf.gather(wpe, positions_for(X, past_length))
解决方案
当您使用交互式会话时,您可以在 python x = 57 中设置值,完全绕过占位符,然后根据需要评估图表的其余部分。
推荐阅读
- javascript - 在 React-Native Expo 上接收 MQTT 消息
- javascript - 如何从 React.js 读取和写入本地 JSON 文件?
- python - Python中积分循环的有效计算
- javascript - 路由Angular时Chart.js渲染问题
- python - 我使用了 Serpapi 谷歌地图抓取代码,但它给了我一个回溯错误
- mysql - MySQL 反向工程仅具有数据的表
- docker - docker compose 无法访问其他容器的端口
- python-3.x - [0,1,2,3,4] 和 [[0],[1],[2],[3],[4]] 有什么区别?
- postgresql - 在 Postgres 中具有类型转换的 JSONB 字段的部分索引
- python - “pyinstaller game.py”工作正常,但 --onefile 不行。(我不能有任何依赖,因为没有 --onefile 就可以工作)