首页 > 解决方案 > 序列分类 Tensorflow - LSTM

问题描述

我有一个看起来像这样的数据框:

id.   date           mycol       label

1.    01/12/2019      c1             1
1.    03/12/2019      c2             1
1.    04/12/2019      c3             1
2.    01/12/2019      c1             0
2.    03/12/2019      c5             0 
3.    15/01/2020       ..            1
4.     ...                           1
.
.

同一id的标签总是相同的,这是一个二元分类问题。我想只为每个 id 预测基于 mycol 的标签,我需要提前 5 个月进行预测。我想我应该使用 LSTM,但问题在于日期和如何设置序列,因为我以前没有见过这种问题,而且我只是从 LSTM 开始。按 id 分组会为每一行提供非常大的 mycol 值列表。我不确定如何以月/周来区分这些值,我是否应该这样做,或者我应该像这样将它们留在每一行的 1 个巨大列表中。帮助将不胜感激。

标签: pythontensorflowlstmsequence

解决方案


您的第一个输入序列应该是 [c1, c2, c3], label - 1,

第二个 - [c1, c5],标签 - 0,

...

序列长度无关紧要(您不必添加填充)。LSTM 学习如何根据新输入(序列元素)更改其状态权重。


推荐阅读