python - 难以在对数刻度的散点图上绘制线性回归线
问题描述
我有一个这样的示例数据框:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame({'a':[0.05, 0.11, 0.18, 0.20, 0.22, 0.27],
'b':[3.14, 1.56, 33.10, 430.00, 239.10, 2600.22]})
我想将这些属性绘制为散点图,然后显示这些样本的线性趋势线。我需要将数据放在对数刻度上的 y 轴 (df['b']) 上。
虽然,当我尝试使用 的帮助来做到这一点时np.polyfit
,我得到了一条奇怪的线。
# Coefficients for polynomial function (degree 1)
coefs = np.polyfit(df['a'], df['b'], 1)
fit_coefs = np.poly1d(coefs)
plt.figure()
plt.scatter(df['a'], df['b'], s = 50, edgecolors = 'black')
plt.plot(df['a'], fit_coefs(df['a']), color='red',linestyle='--')
plt.xlabel('a')
plt.ylabel('b')
plt.yscale('log')
如果我在绘图之前将 df['b] 转换为 log,我可以获得正确的线性趋势,但我想用最后一个绘图的值显示 y 轴,而不是像下面这个转换的 log 值:
df['b_log'] = np.log10(df['b'])
coefs = np.polyfit(df['a'], df['b_log'], 1)
fit_coefs = np.poly1d(coefs)
plt.figure()
plt.scatter(df['a'], df['b_log'], s = 50, edgecolors = 'black')
plt.plot(df['a'], fit_coefs(df['a']), color='red', linestyle='--')
plt.xlabel('a')
plt.ylabel('b_log')
所以基本上,我需要一个像上一个一样的图,但是 y 轴上的值应该像第二个图一样,我仍然会得到正确的线性趋势。任何人都可以帮助我吗?
解决方案
你在那里做了两件不同的事情:首先,你正在为你的指数数据拟合一条线性曲线(这可能不是你想要的),然后你正在为你的日志数据拟合一条线性曲线,这没关系。
为了从对数图中的线性系数中获得线性曲线,您可以这样做10**fit_coefs(df['a'])
:
df['b_log'] = np.log10(df['b'])
coefs = np.polyfit(df['a'], df['b_log'], 1)
fit_coefs = np.poly1d(coefs)
plt.figure()
plt.scatter(df['a'], df['b'], s = 50, edgecolors = 'black')
plt.plot(df['a'], 10**fit_coefs(df['a']), color='red', linestyle='--')
plt.xlabel('a')
plt.ylabel('b_log')
plt.yscale("log")
推荐阅读
- java - 在同一个套接字上的文件之后发送字符串
- java - 在 finally 块内不接受输入
- angular - 如果我更改可观察对象,异步管道是否会自动取消订阅可观察对象?
- reactjs - npm 错误!404 未找到 - 获取 https://registry.npmjs.org/@typescript-eslint%2feslint-plugin - 未找到
- rust - 在 impl 中为带有阴影方法名称的 trait 指定方法实现
- asp.net-core-webapi - Swagger UI 响应类型返回 Status (400) 400BadRequest,而不是 (201) Status201Created 但记录插入成功
- sql - 即使第二个表中缺少 id,也可以加入 2 个表
- flutter - 在颤振中我们如何使用audio_service来获取动态数据
- python-3.x - 如何在 Python 结果中添加 ( 和 )
- c++ - 为什么在 C++ 中返回一个虚拟类 *by value* 会改变 v-table?