首页 > 技术文章 > GRU学习笔记

doubleyue 2021-12-27 19:56 原文

门控循环单元GRU学习笔记

比LSTM更简单的结构

只记住相关的观察需要:

  1. 更新门 -- 能关注的机制
  2. 重置门 -- 能遗忘的机制

,是和隐藏状态同样长度的向量。

下面公式中的几个参数:

  1. \(H_{t-1}\)是隐藏状态;
  2. \(X_t\)是输入;
  3. \(\sigma\)是有激活函数sigmod的fc层,输出范围[0,1]
  4. \(W\)是需要更新的权重矩阵
  5. \(b\)是偏置项

\(R_t\)是重置门(能遗忘的机制):\(R_t=\sigma(X_tW_{xr} + H_{t-1}W_{hr}+b_r)\)
\(Z_t\)是更新门(能关注的机制):\(Z_t=\sigma(X_tW_{xz} + H_{t-1}W_{hz}+b_z)\)
\(\widetilde{H}_t\)是候选隐藏门:\(tanh(X_tW_{xh}+(R_t⊙H_{t-1})W_{hh}+b_h)\)
\(H_t是隐状态:H_t=Z_t⊙H_{t-1}+(1-Z_t)⊙\widetilde{H}_t\)
GRU图

推荐阅读