首页 > 解决方案 > 如何在 Jupyter 笔记本 Python 中操作 2 列数据框

问题描述

我有一个数据框,我试图对其进行操作,以显示在黑暗与光照条件下发生的事故的严重程度差异。

这是具有 200k 条目的 df。

SEVERITYCODE    LIGHTCOND
0   Injury  Light
1   Damage  Dark
2   Damage  Light
3   Damage  Light
4   Injury  Light
5   Damage  Light
6   Damage  Light
7   Injury  Light
8   Damage  Light
9   Injury  Light
10  Damage  Light
11  Damage  Light
12  Damage  Dark
13  Damage  Dark
14  Injury  Dark
15  Damage  Dark
16  Injury  Light
17  Damage  Light
18  Injury  Light
19  Damage  Dark
20  Injury  Dark

我需要能够将这些数据输入 df 以查看类似这样的内容,其中暗伤的发生次数在左上方的框中,黑暗和损坏在右上方的框中,依此类推。

       Injury   Damage
Dark:   10023   1132
Light:  1234    98474

如何让 Python 像这样跨列计数?我不确定是否需要包含图片中的数据来帮助我。1

然后我想把它做成一个堆叠的条形图,以便于可视化,我认为我可以通过其他教程来管理它。

谢谢

标签: pythonpandasdataframejupyter-notebook

解决方案


尝试crosstab

s = pd.crosstab(df['LIGHTCOND'], df['SEVERITYCODE'])

推荐阅读