python - 在熊猫数据框中订购一列
问题描述
我需要创建一个数据框,过滤出“国籍”列中最常列出的五个国家以及它们被列出的总次数。我一直在尝试使用 groupby,但没有成功。我用过的代码
df.groupby(['Nationality']).sum()
我还需要确定参与该计划的人中有多少百分比至少有一个推荐。我也不确定这个代码。
解决方案
过滤掉包含前 5 个国籍的国籍的行:
df[df['Nationality'].isin(df['Nationality'].value_counts().index[:6]) == False]
通过查看 df 的形状来查看它们被列出了多少次,其中行包含排名前 5 的国籍:
df[df['Nationality'].isin(df['Nationality'].value_counts().index[:6])].shape
查看 Number_of_Referalls 的百分比值 > 或 = 1 的快速方法:
(df['Number_of_Referalls '] >= 1).value_counts(normalize=True) * 100
推荐阅读
- python - Python Multiplication different shape to numpy dot product
- node.js - TypeError 无法将属性“firstName”设置为 null
- javascript - 使用烧瓶中的按钮取消选中并选中所有复选框
- python - 如何更改numpy数组中的每个偶数序列
- javascript - 使用javascript获取datalist选项值的选定值
- angular - 错误:文件 lib.dom.d.ts 没有 sourceFile
- ios - 在自定义单元格中实现倒数计时器
- vb.net - 尽管处于保护模式,但仍以编程方式启动 PDF
- php - 为什么我的 php 代码输出与使用 chr 的 C++ 不同
- php - 如何挂钩 get_files 函数