statistics - 在这种情况下我应该如何处理丢失的数据?
问题描述
我正在对一个学校毕业结果的这个非常混乱的数据集进行数据清理,我在这里附上了一些快照:
有很多队列没有统计数据,他们似乎完全随机丢失,MCAR。但是,由于它似乎也遵循时间序列(每年从 2001 年到 2006 年,加上 2016 年 8 月),我不知道删除这些缺少数据的行是否是个好主意。如果我们将它们全部删除,我认为当我们进行聚合以按年份计算某些统计数据时会出现问题。(注意:删除所有这些缺失的行仍然会留下大量数据)。请给我一些关于如何处理这种情况的建议,谢谢!
解决方案
推荐阅读
- python - 检查嵌套列表是否为二叉搜索树
- laravel - 如何使用 laravel 护照配置 swagger
- php - 用双引号 PHP 给出数组值
- python - Pickle EOFError:pygame中的输入用完
- java - 在 java 中使用 google-cloud-secretmanager 客户端库访问多个谷歌云项目的 Secret Manager
- sql - 查询表达式中的语法错误(缺少运算符) - VBA 和 Access
- r - 有没有办法可以使用 RStudio 将日志网格线添加到我的图表中?
- ios - 通过代码将 WKInterfacebutton 背景图像更改为系统模板 (SWIFT)
- laravel - Laravel sortByDesc 链与多链
- azure - Azure ARM 模板用户定义函数