首页 > 解决方案 > 从 Pandas DataFrames 中理解密度图

问题描述

我正在尝试了解特定列的数据分布。它有近 100 万条记录。

这是我为查看密度图而编写的代码。

df[ "ratio"].plot.kde(bw_method=0.1)  # Plot continuous column

https://wellsr.com/python/python-pandas-density-plot-from-a-dataframe/

这是我得到的情节:

在此处输入图像描述

我不清楚x-axisy-axis表示什么?

是来自数据框x-axisratio值吗?

是什么Density意思y-axis以及如何计算?

我们有没有这样的公式可以在 y 轴上推导出这个值?我对推导这些值更感兴趣。鉴于列ratio我们怎么能想出density values。有人可以快速显示数学吗?

标签: python-3.xdensity-plot

解决方案


如果您正在绘制 KDE,则意味着您正在绘制随机变量的概率密度函数 (PDF)。

X 轴将是您正在绘制的参数的值范围。在您的情况下,由于您正在绘制Ratio,因此 X-Axis 将代表您的参数ratio的值范围

另一方面,Y 轴代表内核密度,即您正在绘制的参数的概率。

阅读文档


推荐阅读