首页 > 解决方案 > groupby 不能有效地应用

问题描述

以下是我正在处理的排名数据框:

               Q6     Q17
1      Consultant     NaN
2           Other     NaN
3  Data Scientist    Java
4    Not employed  Python
5    Data Analyst     SQL

我想要:

  1. 计算“数据科学家”每种编程语言出现的次数,并在“计数”列中记录频率
  2. 按降序对计数进行排序
  3. 重置索引并将 Q17 重命名为 Language

以下代码未对每种语言进行分组。

ranking_data = ranking_data[ranking_data.Q6 == 'Data Scientist']
ranking_data_summary = ranking_data.copy().rename(columns = {'Q17':'Language'})
ranking_data_summary['counts'] = ranking_data_summary.groupby('Language') 
['Language'].transform('count')
ranking_data_summary.sort_values('counts',ascending = False, inplace = True)
ranking_data_summary.reset_index(inplace = True)

我究竟做错了什么?

标签: pandasdataframe

解决方案


推荐阅读