python - 在 Python 中查找泰坦尼克号数据集中的幸存人数
问题描述
从 Kaggle 的泰坦尼克号数据集中,我试图提取有多少人幸存下来,有多少人死于该survived
列。为此,我导入了pandas
库并将数据集保存在变量中dataframe
,并使用了以下代码:
dataframe['survived'].value_counts()
这给了我输出
0 809
1 500
Name: survived, dtype: int64
由此,我如何打印幸存的人数?就像我想要 1 的计数一样,我需要输出为 500。当我只想要 0 的计数时也是如此。
我尝试了以下代码只是为了得到一个SyntaxError
dataframe['survived'].value_counts().1
我是熊猫的新手,所以如果有人可以帮助我,我将不胜感激!
解决方案
对于您的情况,您可以使用sum
而不是value_counts
因为您有一个二进制列:1 表示幸存,0 表示死亡,因此总和可以让您全部幸存:
>>> dataframe['survived'].sum()
500
如果您的列不是二进制的,您可以使用:
# 1 stand for survived people here
>>> dataframe['survived'].eq(1).sum()
500
推荐阅读
- oracle - Oracle Alter 命令重命名现有的列错误
- javascript - 可用于动态表的 jQuery ui 排序
- qt-installer - Qt 安装程序框架 - 检查目标目录,如果存在则运行卸载程序
- matlab - 如何在 MATLAB 中将数组保存/导出为 PDF
- ballerina - 我如何在芭蕾舞演员中进行类型检查
- typescript - require('react-native').NativeModules.RNRandomBytes 为空
- linux - httpd 未按预期读取 conf/httpd.conf 中的文档根目录
- ios - 如何从表中获取字距对的值?
- sql - 如何计算明细表中的唯一组合?
- mysql - 用一些逻辑不工作的mysql创建事件