首页 > 解决方案 > 使用 tensorflow seq2seq 模型进行训练

问题描述

我目前正在使用 lstm。我有一个包含许多关于交易信息的句子的数据集,我想提取信息,假设金额、日期和 transactionWith。我已经尝试过使用基本的 lstm,我的系统尝试将给定序列的每个单词预测为金额、日期、transactionWith 或不相关。

我的训练数据是这样的:

输入:

你在 2018 年 8 月 13 日给了约翰 100.00

目标:(标记每个单词)

ir ir 金额 ir transactionWith ir 日期

您可以看到整个数据集有很多“ir”或不相关的标签,我认为这会使我的系统偏向于预测测试数据的“ir”。

现在我想尝试使用张量流的 seq2seq 模型,其中输入是事务句,目标是提取信息的 seq。一个例子是这样的 -

输入:

你在 2018 年 8 月 13 日给了约翰 100.00。

目标:

100.00 13-08-2018 约翰

在这里,我所有的目标序列都将保持固定格式,例如第一个是金额,第二个是日期,第三个是 transactionWith 等。

我可以像语言翻译模型那样做吗?

提前感谢所有很棒的人。:)

标签: tensorflowlstminformation-extractionseq2seq

解决方案


推荐阅读