machine-learning - 我可以先对同一数据集应用“分类”,然后再应用“回归”吗?
问题描述
我是数据科学的初学者,需要某个主题的帮助。
我有一个关于机构客户的数据集。我的目标是首先找出哪些客户将向该机构付款,然后找出付费客户将支付多少钱。
在这种情况下,我认为我可以先通过“分类”找出哪些客户会支付,然后通过应用“回归”找出会支付多少。
所以,首先我想应用“分类”,然后对这个输出应用“回归”。我怎样才能做到这一点?
解决方案
当然,您可以通过垂直堆叠模型来做到这一点。假设您使用的是二进制分类,在预测之后您将拥有一个目标值为 0 和 1 的数据框。您将过滤 where target==1 并创建一个新的数据框。然后运行回归。
此外,如果您没有标签,则可以使用聚类而不是分类,因为成本较低。
推荐阅读
- apache-beam - 管道的额外输入
- sql - 如何根据另一个表多次更新表
- python-3.x - Python:搜索 tkinter 树视图记录。点击搜索后如何跳转到标签记录?
- java - 如何在 Java 中获取 JSONpath 的所有输出路径,以便用它们自己的函数替换现有值
- macos - Mac OS 终端找不到命令
- node.js - 节点js控制器如何保存对象数组的数据
- jq - 将一个对象合并到 json 文件的另一个对象中
- amazon-web-services - AWS API-Gateway Cognito Authorizer 不使用有效的令牌
- python - 如何在一个散点图的自己的列上绘制多个数据集
- python-3.x - 将循环输出保存到多个 Excel 工作表