首页 > 解决方案 > 箱线图可视化

问题描述

所以我必须做这个箱线图,我想限制数据集中列中的变量,我遇到的问题是我不知道该怎么做。这就是我现在所拥有的,我想选择列中的前十个国籍,但我不知道该怎么做。

标签: pythondata-visualizationboxplot

解决方案


如果我正确理解您的问题,这应该适用于名为df“国籍”列的数据框Nationality

import collections

counts = collections.Counter(df.Nationality)
top10countries = [elem for elem, _ in counts.most_common(10)]

df_top10 = df[df['Nationality'].isin(top10countries)]

然后df_top10用来制作箱线图。


推荐阅读