首页 > 解决方案 > MultiIndexed pandas 数据框认为输入是唯一的

问题描述

我不知道为什么,但是每当我尝试对从 csv 或 excel 文件中读取的数据帧进行 multiIndex 时,它都无法正确索引。数据框打印时将“资产”标签视为部分,但日期重复错误。但是,当我执行 '''print(df.index)''' 时,它仍然将“资产”显示为重复值。我该怎么办?

[In] df = pd.read_csv(r'\\####\Redir_Mydocs$\Violet.McCabe\My Documents\Troubleshooting.csv',
                 usecols=[0, 1, 2, 4, 5])


df.set_index(['Assets', 'Date'], inplace=True)
df.sort_index(inplace=True)
print(df)
print(df.index)

[Out]
                         Time  Pressure  Running
Assets         Date                              
BH_Swing Frame 7/18/2020    11         1        1
               7/18/2020    12         1        1
               7/18/2020    13         1        1
              ...
Test           7/18/2020    11         1        1
tester         7/18/2020    11         1        1
               7/18/2020    12         1        1
               7/18/2020    13         1        1
               ...
MultiIndex([('BH_Swing Frame', '7/18/2020'),
            ('BH_Swing Frame', '7/18/2020'),
           ...
            (          'Test', '7/18/2020'),
            (        'tester', '7/18/2020'),
            (        'tester', '7/18/2020'),
            ...],
           names=['Assets', 'Date'])

编辑:这是它在 CSV 文件中的外观:[1]:https ://i.stack.imgur.com/eArbU.png

标签: pythonpandasdataframe

解决方案


推荐阅读