python - 如何在训练前预处理顺序编号的数据?
问题描述
我有一个数据集如下:
小路 | 类标签 |
---|---|
4,3 | 0 |
4,5,3,7 | 1 |
5,3,2,1,8 | 0 |
3,4,5 | 1 |
- “路径”列是一系列具有不同长度 (>=2) 的序列号。
- 数字范围从 1 到 9。
- 每个数字可以在任何位置的“路径”中多次出现。
- “路径”中的每个数字都代表现实世界中的一个状态。
- 目的是根据“路径”数据预测类标签。
在将“路径”用作训练数据之前,我应该如何对其进行预处理?
谢谢,
解决方案
您可以使用循环网络的多对一架构。使用 LSTM 或 GRU 来实现它。
path
您在LSTM/GRU 的每次展开时传入您的单个数字,时间步长是path
该样本的数字。您获取最后一个展开的输出并在其上堆叠一个完全连接的层,最后一层是一个 Dense 层,其大小等于您要预测的类数。
这个关于 pytorch 表单的讨论在 pytroch 中有实现细节。
推荐阅读
- jquery - 如何使用chart.js在laravel中生成动态条形图
- opentext - EXTream 中的慢跑使用
- google-bigquery - BigQuery中2个源表(左外连接查询)匹配时如何返回单行
- react-native - React navigation 5 - 从一个堆栈导航到另一个嵌套堆栈
- flutter - 颤振块:变量未在 BlocBuilder 中定义
- performance - 火花中的广播变量导致性能问题
- javascript - 如何使用新的 Trusted Types 标头和 reCAPTCHA?
- jasper-reports - ireport excel 输出包含空格而不是空列
- python - 如何使列表和字典的功能成为摘要?
- delphi - 为什么 MSFT_PhysicalDisk 总是返回磁盘大小 = 0?