首页 > 解决方案 > 如何对同一 DataFrame 中的两个自变量执行对数和线性回归

问题描述

在此处输入图像描述

以上是著名的波士顿住房数据上的散点图图像。左边是房间数量与房价的明显线性关系。右边是下层社会阶层与房价的统计图。

我按照互联网上所有可用的 tuts 对这两个图进行了线性回归。在训练模型后,我得到的最佳准确度分数是 0.66 或 66%。显然,我遵循的 tuts 在上面显示的两个地图上都执行了线性回归。

但是,红色地图是非线性地图。也许 log(x) 函数可以将其转换为线性映射。

如何在这两个图表上独立执行线性回归 - 黑色 - 使用线性回归和红色 - 使用 Log(x) 变换。(在数据集中,房价在 MEDV 列下给出)并且能够在同一数据集上更准确地进行预测。

最好分步说明。简单的英语会做一个解释。

标签: pandasmachine-learningloggingregression

解决方案


推荐阅读