首页 > 解决方案 > 计算熊猫数据框两列中每个值组合的出现次数并制作条形图

问题描述

我的数据框中有两列包含二进制值。如果项目被批准,project_is_approved 列的值为 1,否则为 0 numbers_in_summary_or_not:还有另一列(命名为“summary”)具有构建此列的文本数据。如果摘要中文本数据中使用了数字,则相应行的值为 1,否则为 0

现在,我想根据这两列可视化我的数据:

numbers_in_summary_or_not,project_is_approved

我认为条形图应该可以工作,我想我需要 4 个条形图来显示 4 个特征

numbers_in_summary_or_not =0 和 project_is_approved =0:第一个条形图 numbers_in_summary_or_not =0 和 project_is_approved =1:第二个条形图 numbers_in_summary_or_not =1 和 project_is_approved =0:第三个条形图 numbers_in_summary_or_not =1 和 project_is_approved =1:第四个条形图 -</p>

标签: pythonpandasdataframevisualization

解决方案


可能是您正在尝试做一些事情,例如绘制这两列组合的计数?

在这种情况下,您可以像这样添加一个将两者结合起来的列

# a series to use for counting- formatted as cat1_cat2
ts = (df['numbers_in_summary_or_not'].astype(str) + '_' + df['project_is_approved'].astype(str))
# and plot the counts of the groups like
ts.value_counts().plot(kind = 'bar')

推荐阅读