python - 序列分类 Tensorflow - LSTM
问题描述
我有一个看起来像这样的数据框:
id. date mycol label
1. 01/12/2019 c1 1
1. 03/12/2019 c2 1
1. 04/12/2019 c3 1
2. 01/12/2019 c1 0
2. 03/12/2019 c5 0
3. 15/01/2020 .. 1
4. ... 1
.
.
同一id的标签总是相同的,这是一个二元分类问题。我想只为每个 id 预测基于 mycol 的标签,我需要提前 5 个月进行预测。我想我应该使用 LSTM,但问题在于日期和如何设置序列,因为我以前没有见过这种问题,而且我只是从 LSTM 开始。按 id 分组会为每一行提供非常大的 mycol 值列表。我不确定如何以月/周来区分这些值,我是否应该这样做,或者我应该像这样将它们留在每一行的 1 个巨大列表中。帮助将不胜感激。
解决方案
您的第一个输入序列应该是 [c1, c2, c3], label - 1,
第二个 - [c1, c5],标签 - 0,
...
序列长度无关紧要(您不必添加填充)。LSTM 学习如何根据新输入(序列元素)更改其状态权重。
推荐阅读
- python - 列表中元组的交集 - python
- hyperledger-fabric - Hyperledger Fabric CA:http:来自 127.0.0.1:53356 的 TLS 握手错误:tls:收到长度为 21536 的超大记录
- vue.js - Vue flickr 应用程序中的搜索栏未提供预期结果
- javascript - 将任何 URL 转换为相对 URL
- meteor - 当我尝试运行 npm install 时 Meteor 抛出 gyp 错误
- c# - 使用 IdentityServer4 加载项目时 DefaultUserSession 中的 NullReferenceException
- powershell - 获取一个AD用户的经理并将其输入到表格的列中
- css - 使用 ::before 作为创造空间的方式的目的是什么?
- swift - Swift 不会在具有关联类型的协议扩展函数中调用重写的类 var
- c# - 构建项目 .Net 本机工具链启用导致内部编译器错误:已添加具有相同密钥的项目