首页 > 解决方案 > 如何计算具有相同索引的元素?

问题描述

我必须从 CSV 文件中获取每个州的县数,然后返回哪个州的县数最多。但我不知道如何计算同一索引下的元素

.csv 文件: 在此处输入图像描述

我尝试使用 .count() 和 numerate() 但返回一个错误键错误:“Alabama”

这是我用来从 CSV 文件创建实际数据框的代码

import pandas as PD

census = pd.read_csv('census.csv')
counties = pd.DataFrame({'State':census['STNAME'],'County':census['CTYNAME'],
         'populations':census['CENSUS2010POP'],'population 2010': census['POPESTIMATE2010'], 
         'population 2015': census['POPESTIMATE2015']})
counties = counties.set_index(['State', 'County'])

标签: pythonpandas

解决方案


尝试:

counties.groupby(['State','County']).agg('count')

代替:

counties = counties.set_index(['State', 'County']).count()

推荐阅读