python-3.x - 从 Pandas DataFrames 中理解密度图
问题描述
我正在尝试了解特定列的数据分布。它有近 100 万条记录。
这是我为查看密度图而编写的代码。
df[ "ratio"].plot.kde(bw_method=0.1) # Plot continuous column
https://wellsr.com/python/python-pandas-density-plot-from-a-dataframe/
这是我得到的情节:
我不清楚x-axis
和y-axis
表示什么?
是来自数据框x-axis
的ratio
值吗?
是什么Density
意思y-axis
以及如何计算?
我们有没有这样的公式可以在 y 轴上推导出这个值?我对推导这些值更感兴趣。鉴于列ratio
我们怎么能想出density values
。有人可以快速显示数学吗?
解决方案
如果您正在绘制 KDE,则意味着您正在绘制随机变量的概率密度函数 (PDF)。
X 轴将是您正在绘制的参数的值范围。在您的情况下,由于您正在绘制Ratio,因此 X-Axis 将代表您的参数ratio的值范围
另一方面,Y 轴代表内核密度,即您正在绘制的参数的概率。
推荐阅读
- apache-kafka - 如何使用 Kerberos 安装 librdkafka?
- lumen - Lumen如何缓存配置?
- c# - 使用鼠标 Unity 围绕对象旋转相机
- php - 根据 Woocommerce 3 中的外部服务响应更新订单状态
- ios - 在 Swift 中的视图控制器之间传递数据不起作用
- bash - 从标准输入读取,停止,然后提示
- sql - 使用 EXTRACT 函数从时间戳获取年份或月份时出错
- scala - 通过一些列值拆分 Spark 数据帧,然后独立于其他数据帧旋转每个生成的数据帧
- javascript - 如何更改此 InDesign TOC 超链接脚本,以使整个段落(而不仅仅是页码)用作超链接?
- sql - 使用 Sql Server 从完整路径解析 Html 文件名