首页 > 解决方案 > 在 Python 中查找泰坦尼克号数据集中的幸存人数

问题描述

从 Kaggle 的泰坦尼克号数据集中,我试图提取有多少人幸存下来,有多少人死于该survived列。为此,我导入了pandas库并将数据集保存在变量中dataframe,并使用了以下代码:

dataframe['survived'].value_counts()

这给了我输出

0    809
1    500
Name: survived, dtype: int64

由此,我如何打印幸存的人数?就像我想要 1 的计数一样,我需要输出为 500。当我只想要 0 的计数时也是如此。

我尝试了以下代码只是为了得到一个SyntaxError

dataframe['survived'].value_counts().1

我是熊猫的新手,所以如果有人可以帮助我,我将不胜感激!

标签: pythonpandas

解决方案


对于您的情况,您可以使用sum而不是value_counts因为您有一个二进制列:1 表示幸存,0 表示死亡,因此总和可以让您全部幸存:

>>> dataframe['survived'].sum()
500

如果您的列不是二进制的,您可以使用:

# 1 stand for survived people here
>>> dataframe['survived'].eq(1).sum()
500

推荐阅读