apache-spark - 数值数据的逻辑回归
问题描述
我有这些标签和功能,例如
labels features
[2.3] 1 5.1 7.2 5 5 5
[5.4] 4.5 3 2 4 6 4
[6.3] 3.3 1.3 5.4 6
像这样,我有超过 10K 条目。如何使用逻辑回归在 spark 中训练模型?我知道我们可以使用线性回归。但是,我仍然想使用 LogisticReg 来检查它的性能。到目前为止,我所做的是将这些类映射到离散值,就像(2.3->0,5.4->1, 6.3->2)
我找到了 11101 个唯一标签一样。但是计算需要很多时间。
解决方案
您拥有的那些标签似乎是连续变量(而不是离散变量)。据我所知,Spark 中的逻辑回归只能用于分类,不能用于回归(https://spark.apache.org/docs/2.2.0/ml-classification-regression.html)。
推荐阅读
- javascript - 通过猫鼬nestjs中的属性获取用户的正确方法
- python - 如何计算列表 PYTHON 中的元素?
- python - Beautiful Soup 如何遍历 URL 列表以抓取多个文本字段
- python - 在购物车中添加第一个产品会返回完整性错误
- flutter - 如何使用 blocs 和 auto_route 在颤动中创建小部件/单元测试?
- c# - ExecuteSqlInterpolatedAsync EF Core 在数据库中插入失败
- github-actions - GitHub Workflows 输入参数的下拉列表
- javascript - 在 iframe 中滚动
- node.js - Node.js 异步和同步集成
- python - 如何裁剪在具有旋转 QGraphicsRectItem 的场景上设置的 QPixmap?