首页 > 解决方案 > 数值数据的逻辑回归

问题描述

我有这些标签和功能,例如

labels features
 [2.3]   1 5.1 7.2 5 5 5
 [5.4]   4.5 3 2 4 6 4
 [6.3]   3.3 1.3 5.4 6

像这样,我有超过 10K 条目。如何使用逻辑回归在 spark 中训练模型?我知道我们可以使用线性回归。但是,我仍然想使用 LogisticReg 来检查它的性能。到目前为止,我所做的是将这些类映射到离散值,就像(2.3->0,5.4->1, 6.3->2) 我找到了 11101 个唯一标签一样。但是计算需要很多时间。

标签: apache-sparkapache-spark-mlliblogistic-regressionapache-spark-ml

解决方案


您拥有的那些标签似乎是连续变量(而不是离散变量)。据我所知,Spark 中的逻辑回归只能用于分类,不能用于回归(https://spark.apache.org/docs/2.2.0/ml-classification-regression.html)。


推荐阅读