python - 箱线图可视化
问题描述
所以我必须做这个箱线图,我想限制数据集中列中的变量,我遇到的问题是我不知道该怎么做。这就是我现在所拥有的,我想选择列中的前十个国籍,但我不知道该怎么做。
解决方案
如果我正确理解您的问题,这应该适用于名为df
“国籍”列的数据框Nationality
:
import collections
counts = collections.Counter(df.Nationality)
top10countries = [elem for elem, _ in counts.most_common(10)]
df_top10 = df[df['Nationality'].isin(top10countries)]
然后df_top10
用来制作箱线图。
推荐阅读
- node.js - 如何使用猫鼬在 HH:mm 格式时间之间查找 MongoDB 中的所有文档?
- tensorflow - 使用队列运行器将 tensorflow 模型转换为 coreml
- arrays - 如何将项目推送到 Angular 列表?
- c# - 如何使用 ASP.NET MVC Web 应用程序在远程服务器上正确运行 exe 文件?
- node.js - for循环中多个异步函数后的NodeJS回调
- powerbuilder - Powerbuilder 12.6 中是否可以使用多线程?
- rabbitmq - RabbitMQ 交换绑定参数
- ios - 更改一个文本字段的值也会无意中更改几个其他文本字段。我该如何防止这种情况?
- javascript - 返回在Javascript中返回未定义
- jmeter - 如何在 JMeter 中读取每个请求的随机数据