首页 > 解决方案 > ValueError:长度不匹配:预期轴有 2 个元素,新值有 3 个元素

问题描述

这是我计划用于创建饼图的代码。

import csv
with open('C:\\Users\Bhuwan Bhatt\Desktop\IP PROJECT\Book1.csv', 'r') as file :
    reader = csv.reader(file)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

def piechart1():
   df=pd.read_csv('data,csv',  sep=' ', index_col=False,skipinitialspace=True\
                 ,error_bad_lines=False,encoding= 'unicode_escape')
   df=df.set_index(['Country'])
   dfl=df.iloc[:,[14]]
   final_df=dfl.sort_values(by='TotalMedal')
   final_df.reset_index(inplace=True)
   final_df.columns=('location','Total cases','Total Deaths')
   final_df=final_df.drop(11,axis='index')
   countries=df['Country']
   tmedals=df['TotalMedal']
   plt.pie(tmedals,labels=countries,explode=(0.1,0,0,0,0,0,0,0,0,0,0.2),shadow=True,autopct='%0.1f%%')
   plt.title("Olympics data analysis\nTop 10 Countries", color='b',fontsize=12)
   plt.gcf().canva.set_window_title("OLMPICS ANALYSIS")
   plt.show()

由于某种原因,我收到此错误:

AttributeError: 'DataFrameGroupBy' object has no attribute 'sort_values'

这是我一直在使用的 CSV 文件:

Country SummerTimesPart Sumgoldmedal    Sumsilvermedal  Sumbronzemedal  SummerTotal WinterTimesPart Wingoldmedal    Winsilvermedal  Winbronzemedal  WinterTotal TotalTimesPart  Tgoldmedal  Tsilvermedal    Tbronzemedal    TotalMedal
     Afghanistan    14  0   0   2   2   0   0   0   0   0   14  0   0   2   2
     Algeria    13  5   4   8   17  3   0   0   0   0   16  5   4   8   17
     Argentina  24  21  25  28  74  19  0   0   0   0   43  21  25  28  74
     Armenia    6   2   6   6   14  7   0   0   0   0   13  2   6   6   14

INFO-----> SummerTimesPart  :  No. of times participated in summer by each country
           WinterTimesPart  :  No. of times participated in winter by each country

标签: pythonpandassyntax-errordata-visualizationpie-chart

解决方案


在您的代码中,您设置Country为 Index 并在此行中

dfl=df.iloc[:,[14]]

您只需选择一列即TotalMedal.
排序和重置索引后,您尝试按行更改列名

final_df.columns=('location','Total cases','Total Deaths')

这是错误..您仅过滤了一列的数据框,并且在重置后Country也进入了列。因此,您的数据框中只有两列,并尝试通过提供三个值来更改列的名称。

正确的行可能是 -

final_df.columns=('location','TotalMedal')

推荐阅读