首页 > 解决方案 > 难以在对数刻度的散点图上绘制线性回归线

问题描述

我有一个这样的示例数据框:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.DataFrame({'a':[0.05, 0.11, 0.18, 0.20, 0.22, 0.27],
                  'b':[3.14, 1.56, 33.10, 430.00, 239.10, 2600.22]})

在此处输入图像描述

我想将这些属性绘制为散点图,然后显示这些样本的线性趋势线。我需要将数据放在对数刻度上的 y 轴 (df['b']) 上。

虽然,当我尝试使用 的帮助来做到这一点时np.polyfit,我得到了一条奇怪的线。

# Coefficients for polynomial function (degree 1) 
coefs = np.polyfit(df['a'], df['b'], 1)
fit_coefs = np.poly1d(coefs)

plt.figure()
plt.scatter(df['a'], df['b'], s = 50, edgecolors = 'black') 
plt.plot(df['a'], fit_coefs(df['a']), color='red',linestyle='--')
plt.xlabel('a') 
plt.ylabel('b')
plt.yscale('log')

在此处输入图像描述

如果我在绘图之前将 df['b] 转换为 log,我可以获得正确的线性趋势,但我想用最后一个绘图的值显示 y 轴,而不是像下面这个转换的 log 值:

df['b_log'] = np.log10(df['b'])

coefs = np.polyfit(df['a'], df['b_log'], 1)
fit_coefs = np.poly1d(coefs)

plt.figure()
plt.scatter(df['a'], df['b_log'], s = 50, edgecolors = 'black') 
plt.plot(df['a'], fit_coefs(df['a']), color='red', linestyle='--') 
plt.xlabel('a') 
plt.ylabel('b_log')

在此处输入图像描述

所以基本上,我需要一个像上一个一样的图,但是 y 轴上的值应该像第二个图一样,我仍然会得到正确的线性趋势。任何人都可以帮助我吗?

标签: pythonpandasmatplotliblinear-regressionpolynomials

解决方案


你在那里做了两件不同的事情:首先,你正在为你的指数数据拟合一条线性曲线(这可能不是你想要的),然后你正在为你的日志数据拟合一条线性曲线,这没关系。

为了从对数图中的线性系数中获得线性曲线,您可以这样做10**fit_coefs(df['a'])

df['b_log'] = np.log10(df['b'])

coefs = np.polyfit(df['a'], df['b_log'], 1)
fit_coefs = np.poly1d(coefs)

plt.figure()
plt.scatter(df['a'], df['b'], s = 50, edgecolors = 'black') 
plt.plot(df['a'], 10**fit_coefs(df['a']), color='red', linestyle='--') 
plt.xlabel('a')
plt.ylabel('b_log')
plt.yscale("log")

推荐阅读