pandas - 如何从 3000 个值中选择 50 个最常出现的值来制作直方图?
问题描述
我有一个包含 3000 个唯一名称的 1 列的数据集。数据集示例如下:
SPEAKER:
dwayne-bohac
scott-surovell
barack-obama
blog-posting
charlie-crist
唯一值的数量:
print(trainer['SPEAKER'].nunique())
输出:
2915
价值计数:
print(trainer['SPEAKER'].value_counts().sort_values(ascending=False))
输出:
barack-obama 491
donald-trump 274
hillary-clinton 239
mitt-romney 179
scott-walker 150
...
sam-rashid 1
我想选择 50 个最常出现的名称来制作直方图。熊猫库中有内置功能吗?任何建议将不胜感激。
解决方案
使用head
和plot.bar
:
(trainer['SPEAKER']
.value_counts()
.sort_values(ascending=False)
.head(50)
.plot.bar()
)
推荐阅读
- javascript - 如何识别是否加载了子动态组件
- javascript - Js:对对象数组进行排序和重新排列
- java - java jackson在序列化对象类型的变量后保留类型信息
- java - 在android中解析多个数组
- java - mysql连接池超时
- php - 除了重写规则中的一些 url
- php - Paytm 退款 api 给出 501 - 响应系统错误
- swagger - Flasgger POST 路由中的文件上传选择器
- apache - 我们如何从 apache httpd 生成 S3 签名
- node.js - ExpressJS 服务器每晚离线 - 502 Bad Gateway