首页 > 解决方案 > 是否有某种方法可以导入由多行组成的数据?

问题描述

在 RapidMiner 中,我通常看到的数据表是这样的:

Row    Age      Class
1      19       Adult
2      10       Minor
3      15       Teenager

在这句话上面的数据表中,一行代表一个完整的信息。

但是如何将数据表输入到RapidMiner,其中多行表示一个完整的信息?

例如:

Row      Word      Rho       Theta    Phi
1        Hello     0.9384    0.4943   1.2750
2        Hello     1.2819    0.8238   1.3465
3        Hello     1.3963    0.1758   1.4320
4        Eat       1.3918    0.3883   1.1756
5        Eat       1.4742    0.0526   1.2312
6        Eat       0.6698    0.2548   1.4769
7        Eat       0.3074    1.2214   0.2059

在这句话上面的数据表中,第 1-3 行是指一个完整的信息,其中第 1-3 行的 rho、theta 和 phi 的组合表示单词 hello。第 4-7 行也是如此,这是一个完整的信息,也意味着吃这个词。要进一步解释我正在谈论的信息,请查看这句话下方的表格。

Row     Rho       Theta      Phi      Word
        ----------------------------
1       |0.9384   0.4943     1.2750|
2       |1.2819   0.8238     1.3465|  HELLO
3       |1.3963   0.1758     1.4320|
        ----------------------------
4       |1.3918    0.3883    1.1756|
5       |1.4742    0.0526    1.2312|
6       |0.6698    0.2548    1.4769|  EAT
7       |0.3074    1.2214    0.2059|
        ----------------------------

我的问题是,如何将这种数据表插入到 RapidMiner 中,它知道多行引用一个完整的信息?有没有像我在这句话下面显示的那样的表格?

Row      Word      Rho      Theta     Phi
1        Hello     0.9384    0.4943   1.2750
.        Hello     1.2819    0.8238   1.3465
1        Hello     1.3963    0.1758   1.4320
2        Eat       1.4742    0.0526   1.2312
.        Eat       0.6698    0.2548   1.4769
.        Eat       0.3074    1.2214   0.2059
2        Eat       0.3074    1.2214   0.2059

标签: rapidminer

解决方案


您可以尝试使用Pivot运算符按单词对结果进行分组。

为此,我会将group 属性参数设置为“Word”,将index参数设置为“Row”。它不是完全相同的表示,但足够接近,具体取决于您的用例,因为多个格式表不是 RapidMiner 设计的一部分。


推荐阅读