rapidminer - 是否有某种方法可以导入由多行组成的数据?
问题描述
在 RapidMiner 中,我通常看到的数据表是这样的:
Row Age Class
1 19 Adult
2 10 Minor
3 15 Teenager
在这句话上面的数据表中,一行代表一个完整的信息。
但是如何将数据表输入到RapidMiner,其中多行表示一个完整的信息?
例如:
Row Word Rho Theta Phi
1 Hello 0.9384 0.4943 1.2750
2 Hello 1.2819 0.8238 1.3465
3 Hello 1.3963 0.1758 1.4320
4 Eat 1.3918 0.3883 1.1756
5 Eat 1.4742 0.0526 1.2312
6 Eat 0.6698 0.2548 1.4769
7 Eat 0.3074 1.2214 0.2059
在这句话上面的数据表中,第 1-3 行是指一个完整的信息,其中第 1-3 行的 rho、theta 和 phi 的组合表示单词 hello。第 4-7 行也是如此,这是一个完整的信息,也意味着吃这个词。要进一步解释我正在谈论的信息,请查看这句话下方的表格。
Row Rho Theta Phi Word
----------------------------
1 |0.9384 0.4943 1.2750|
2 |1.2819 0.8238 1.3465| HELLO
3 |1.3963 0.1758 1.4320|
----------------------------
4 |1.3918 0.3883 1.1756|
5 |1.4742 0.0526 1.2312|
6 |0.6698 0.2548 1.4769| EAT
7 |0.3074 1.2214 0.2059|
----------------------------
我的问题是,如何将这种数据表插入到 RapidMiner 中,它知道多行引用一个完整的信息?有没有像我在这句话下面显示的那样的表格?
Row Word Rho Theta Phi
1 Hello 0.9384 0.4943 1.2750
. Hello 1.2819 0.8238 1.3465
1 Hello 1.3963 0.1758 1.4320
2 Eat 1.4742 0.0526 1.2312
. Eat 0.6698 0.2548 1.4769
. Eat 0.3074 1.2214 0.2059
2 Eat 0.3074 1.2214 0.2059
解决方案
您可以尝试使用Pivot
运算符按单词对结果进行分组。
为此,我会将group 属性参数设置为“Word”,将index参数设置为“Row”。它不是完全相同的表示,但足够接近,具体取决于您的用例,因为多个格式表不是 RapidMiner 设计的一部分。
推荐阅读
- django - 为什么我不能通过 django-admin 使用我的 Django 实用程序
- java - 如何正确地将 int 值从 firebase 实时数据库检索到 textview?
- azure - 以编程方式进行带有排除项的 Azure 策略分配
- python - 如何在 Pandas Dataframe 中应用 If Else 语句?
- azure - 使用 HTTP 触发器调用逻辑应用时出现 DirectApiRequestHasMoreThanOneAuthorization 错误
- c - read() 不读取套接字缓冲区上的剩余字节
- substrate - 构建错误时出错 [E0282]:需要类型注释
- javascript - jsPDF,来自url的base64图像:未定义dataurl
- python - ValueError:无法将字符串转换为浮点数:'Bad'
- javascript - 创建原型继承时代理实例更改类?