首页 > 解决方案 > 在这种情况下我应该如何处理丢失的数据?

问题描述

我正在对一个学校毕业结果的这个非常混乱的数据集进行数据清理,我在这里附上了一些快照: 在此处输入图像描述

在此处输入图像描述

有很多队列没有统计数据,他们似乎完全随机丢失,MCAR。但是,由于它似乎也遵循时间序列(每年从 2001 年到 2006 年,加上 2016 年 8 月),我不知道删除这些缺少数据的行是否是个好主意。如果我们将它们全部删除,我认为当我们进行聚合以按年份计算某些统计数据时会出现问题。(注意:删除所有这些缺失的行仍然会留下大量数据)。请给我一些关于如何处理这种情况的建议,谢谢!

标签: statisticsdata-cleaninganalysis

解决方案


推荐阅读