pandas - groupby 不能有效地应用
问题描述
以下是我正在处理的排名数据框:
Q6 Q17
1 Consultant NaN
2 Other NaN
3 Data Scientist Java
4 Not employed Python
5 Data Analyst SQL
我想要:
- 计算“数据科学家”每种编程语言出现的次数,并在“计数”列中记录频率
- 按降序对计数进行排序
- 重置索引并将 Q17 重命名为 Language
以下代码未对每种语言进行分组。
ranking_data = ranking_data[ranking_data.Q6 == 'Data Scientist']
ranking_data_summary = ranking_data.copy().rename(columns = {'Q17':'Language'})
ranking_data_summary['counts'] = ranking_data_summary.groupby('Language')
['Language'].transform('count')
ranking_data_summary.sort_values('counts',ascending = False, inplace = True)
ranking_data_summary.reset_index(inplace = True)
我究竟做错了什么?
解决方案
推荐阅读
- python - NumPy 转换中的 PyTorch 就地运算符问题
- compilation - 获得 CATIA V5 R30 CAA 构建的编译错误
- javascript - nodejs中的UTF-16
- axapta - 按语句 AX2012 R3 分组计数
- apache-spark - pyspark 在工人中重复。计算文本文件中的单词
- angular - 角材料步进器未显示
- c++ - G++-11 销毁顺序由 G++9 更改
- suitecrm - 在电子邮件模板中默认显示/添加跟踪器
- amazon-web-services - AWS AppConfig 检索多个 Parameter Store
- pdf - PDF 视图 - 视图不显示,除非缩小