首页 > 解决方案 > 如何从 3000 个值中选择 50 个最常出现的值来制作直方图?

问题描述

我有一个包含 3000 个唯一名称的 1 列的数据集。数据集示例如下:

SPEAKER:
dwayne-bohac
scott-surovell
barack-obama
blog-posting
charlie-crist

唯一值的数量:

print(trainer['SPEAKER'].nunique())

输出:

2915

价值计数:

print(trainer['SPEAKER'].value_counts().sort_values(ascending=False))

输出:

barack-obama       491
donald-trump       274
hillary-clinton    239
mitt-romney        179
scott-walker       150
                  ... 
sam-rashid           1

我想选择 50 个最常出现的名称来制作直方图。熊猫库中有内置功能吗?任何建议将不胜感激。

标签: pandas

解决方案


使用headplot.bar

(trainer['SPEAKER']
        .value_counts()
        .sort_values(ascending=False)
        .head(50)
        .plot.bar()
)

推荐阅读