首页 > 解决方案 > 如何按报告日期查找和分组 NA 的 22 列,并将这些列作为多索引

问题描述

美好的一天,伙计们!

我想找出所有缺少值的列,识别它们的名称并按报告日期和列名进行分组,以了解何时出现缺失值。

我为我的任务的第一部分找到了很好的决定:

df.drop(‘ReportDate’, 1).isna().groupby(df[na_columns], sort = True)[na_columns].sum()
na_columns = df.isnull().any()

但我不知道如何从列中创建索引......

我想得到这样的结果数据框:

Index 1    Index 2     Count of na
2018-01-31 na_column_1    100
           na_column_2    500
              ...
           na_column_N    350
 
2018-02-28 na_column_1    100
           na_column_2    500
              ...
           na_column_N    350
   ...

2020-12-31 na_column_1    100
           na_column_2    500
              ...
           na_column_N    350

标签: pythonpandasgroup-bynamulti-index

解决方案


推荐阅读