pandas - Seaborn Catplot 抛出错误:真值不明确
问题描述
我正在尝试使用 seaborn 库为我的数据框中的所有分类变量做一个 catplot,但我会因为模棱两可的真值而出错。它通常发生在“&”值上,但我无法在这里找到根本原因。我的目标是连续变量。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
target = df[target_col]
features = df[df.columns.difference([target_col])]
cat_cols = features.select_dtypes(include=['object']).columns.to_list()
fig, axes = plt.subplots(round(len(cat_cols) / 3), 3, figsize=(15, 15))
for i, ax in enumerate(fig.axes):
if i < len(cat_cols):
sns.catplot(x=cat_cols[i], y=target, kind='bar',data=df, ax = ax)
但我收到以下错误。哪个部分导致此值错误?
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
解决方案
sns.catplot 是一个网格级别的图,所以你不应该把它放到一个子图中。您可以使用带有条形图的 facetgrid:
例如,这是您的数据:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame({'y':np.random.uniform(0,1,50),'A':np.random.choice(['a1','a2'],50),
'B':np.random.choice(['b1','b2'],50),'C':np.random.randint(0,10,50),
'D':np.random.choice(['d1','d2'],50),'E':np.random.choice(['e1','e2'],50)})
target_col = "y"
cat_cols = df.columns[df.dtypes==object]
seaborn 在长格式下效果更好,因此您可以像这样长时间旋转您的数据:
df.melt(id_vars=target_col,value_vars=cat_cols)
y variable value
0 0.606734 A a1
1 0.603324 A a2
2 0.938280 A a2
3 0.718703 A a1
4 0.808013 A a1
column 变量现在定义了要绘制的构面,x 轴是您的值。我们直接调用它:
g = sns.FacetGrid(df.melt(id_vars=target_col,value_vars=cat_cols),
col='variable', sharex=False,col_wrap=3)
g.map_dataframe(sns.barplot, x="value", y="y")
推荐阅读
- c# - 加载弹出表单交叉线程
- amazon-s3 - 允许使用 Cognito 凭证的请求的 S3 策略:AWS
- javascript - `this` 的属性在 setTimeout 中未定义
- node.js - 错误:已知 npm 不能在 Node.js v 上运行
- google-apps-script - 随机字符串生成器随机化太频繁
- visual-studio-code - VSCode 按名称终止任务
- java - 二叉树节点计算的递归方法
- c# - 无法从“System.Transactions.IsolationLevel”转换为“System.Data.IsolationLevel”
- ios - iOS - 大小类的不同堆栈视图
- c++ - 逆向工程项目到图形 UML 图