首页 > 解决方案 > 使用pairplot和相关方法观察数据框不同变量之间的关系

问题描述

我从 Kaggle 获取了 Pima 糖尿病数据,用于处理和创建数据。但是,我想绘制我已将 pima 数据导入到的数据框的两个不同变量之间的关系。我可以使用以下查询来实现它。

sns.pairplot(pima_data)

数据信息如下:

 Pregnancies  Glucose  BloodPressure  SkinThickness  Insulin   BMI  \
0            6      148             72             35        0  33.6   
1            1       85             66             29        0  26.6   
2            8      183             64              0        0  23.3   
3            1       89             66             23       94  28.1   
4            0      137             40             35      168  43.1   

   DiabetesPedigreeFunction  Age  Outcome  
0                     0.627   50        1  
1                     0.351   31        0  
2                     0.672   32        1  
3                     0.167   21        0  
4                     2.288   33        1 

下面是图形图像:

Pima 糖尿病的配对图信息

但是,我无法弄清楚如何同时使用相关方法和配对图绘制两个不同变量之间的关系。

标签: pythonpandasnumpyseaborn

解决方案


您是否尝试在每个散点图的顶部绘制线性回归?

iris = sns.load_dataset("iris")
g = sns.PairGrid(iris)
g = g.map_diag(plt.hist)
g = g.map_offdiag(sns.regplot)

在此处输入图像描述


推荐阅读