首页 > 解决方案 > Pearsonr 和 p 值

问题描述

我正在分析 pandas 中的一些数据并使用sns.jointplot()函数绘制两个变量之间的相关性。这两个函数之间的关联结果如下所示: 在此处输入图像描述

pearsonr 的值为 0.41,p 为 5e-18。我可以从这两个值中推断出什么。这两个变量之间有没有很好的关系。

另外,如果我只想在绘图上显示 pearsonr,我应该如何更改我的代码。下面是我目前使用的代码。

ax=sns.jointplot(df['Comfort'], df['Assurance'],data=df, kind="kde", color='r');

标签: pythonpandasseabornp-valuepearson-correlation

解决方案


pearsonr 的值为 0.41,p 为 5e-18。我可以从这两个值中推断出什么。这两个变量之间有没有很好的关系。

粗略地讲:

  • 相关系数 ( 0.41) 的大小表明正相关性较低。
  • p 值 ( 5e-18) 表明相关系数具有统计显着性,远小于 0.01(0.01 ---> 在实际上不存在相关性时得出结论存在相关性的风险为 1%)。
  • 请记住,皮尔逊相关系数仅衡量线性关系。您可以获得0具有强非线性关系的变量(数据集)的 Pearson 相关系数。此外,您假设您的变量(数据集)是正态分布的。

另外,如果我只想在绘图上显示 pearsonr,我应该如何更改我的代码。

seaborn 0.9.0不显示该信息。要添加该信息,您可以使用 计算该值scipy.stats.pearsonr,然后将其显示为图形标题的一部分。


推荐阅读