tensorflow - 寻找 TensorFlow 等效的 Pytorch GRU 功能
问题描述
我对如何在 TensorFlow 中重建以下 Pytorch 代码感到困惑。它同时使用输入大小x
和隐藏大小h
来创建 GRU 层
import torch
torch.nn.GRU(64, 64*2, batch_first=True, return_state=True)
本能地,我首先尝试了以下方法:
import tensorflow as tf
tf.keras.layers.GRU(64, return_state=True)
但是,我意识到它并没有真正考虑h
或隐藏大小。在这种情况下我该怎么办?
解决方案
在您的 tensorflow 示例中,隐藏大小为 64。要获得等价物,您应该使用
import tensorflow as tf
tf.keras.layers.GRU(64*2, return_state=True)
这是因为 keras 层不需要您指定输入大小(本例中为 64);它是在您第一次构建或运行模型时决定的。
推荐阅读
- java - Thymeleaf 元素模型处理
- python - 如何将列表中的值分配给数据框中的一组值?
- react-redux - 如何使用 react hooks、redux 将图像上传到数据库?
- postgresql - 如何在 Postgresql 中存储列表?
- laravel - 如何为 Laravel 中的每种异常设置不同的日志级别?
- delphi - 使用 GDI+ 的线程 JPEG 解码随机触发“没有足够的内存资源可用于处理此命令”
- excel - 从三个工作表上的三个列表中提取唯一值
- wordpress - 拒绝在框架中显示“https://www.google.com/”,因为它在 Wordpress 中将“X-Frame-Options”设置为“sameorigin”
- swift - 从另一个类访问变量给 0 swift
- angular - 无法通过在 angular-slickgrid 中向左或向右拖动来操纵列大小