r - 处理geepack R中的缺失值
问题描述
我有一个纵向数据集,其中包括前往诊所接受结核病治疗的受试者。在每次访问中,都会记录几个潜在的预测因素,并且每次访问都有一个二元结果,无论结果是有利还是不利。
一些预测变量在某些访问中缺少数据,而在同一访问中,其他预测变量具有该访问的完整数据。
当我使用 R 中的 geepack 包运行一个 gee 模型时,它给了我一个错误,我发现是丢失的数据导致了错误,因为 gee 可以处理完整的数据。
但是,如果我因为一个预测变量缺失而其他预测变量完整而删除了一个观察,我会丢弃大量数据。有解决方法吗?
解决方案
如果您必须拥有完整的数据,您可以尝试估算它。一种流行的图书馆/方法是“老鼠”。
但是,您必须对这种方法非常小心,因为,好吧,弥补数据是一件大事。特别是,现实世界的东西经常会随机丢失。也许极端值更有可能丢失,或者更有可能被记录下来。我的印象是,如何正确地做到这一点仍然是一个开放的研究问题。
也许在这里查看教程https://datascienceplus.com/imputing-missing-data-with-r-mice-package/或它链接到的简化版本,看看这是否适用于您的情况,YMMV。
推荐阅读
- html - 当我切换到按月/按年计费时,我得到“NaN”作为文本内容。否则,我的 JS 代码运行良好。我的代码片段附在下面
- python - 更新 Discord 中已存在的嵌入消息
- reactjs - 如果没有找到值,如何返回对象,否则使用条件循环并使用反应和打字稿返回对象?
- ios - Swift - 使用 snapkit 的滚动视图中的 pageviewcontroller 表视图
- sql-server - 使用 SSIS 包将带有嵌套节点的 XML 导入 SQL Server 数据库,并将文件中的记录 ID 添加到每个插入
- javascript - 当名称和值位于不同的 XML 节点中时,使用 Javascript 从 XML 中的某些节点解析属性?
- .net - 如何在 azure 管道上使用 vstest 解决程序集绑定问题
- javascript - Chrome 开发控制台:JS 代码打开标签并在新标签中执行 js 片段
- docker - 无法在 docker-compose 中解析 Elasticsearch 中的占位符“ES_PWD”
- flutter - 库 'package:vin_decoder/vin_decoder.dart' 是遗留的,不应导入到空安全库中