imputation - 您使用哪种算法通过链式方程 (MICE) 进行多重插补是否重要
问题描述
我见过用不同类型的算法实现的 MICE,例如 RandomForest 或 Stochastic Regression 等。
我的问题是,哪种类型的算法(即一种算法表现最好)是否重要?有经验证据吗?我正在努力在网上找到任何信息
谢谢
解决方案
是的,(取决于您的任务)您选择哪种算法可能非常重要。
你也可以肯定,mice
如果有一种算法总是表现最好,开发人员不会努力提供不同的算法。因为,当然,就像在机器学习中一样,“没有免费的午餐定理”也与插补有关。
一般来说,您可以说,鼠标的默认设置通常是一个不错的选择。
从miceRanger Vignette 中查看此示例,了解不同算法的插补可以相差多远。(真实分布用红色标记,各自的多重插补用黑色标记)
例如,预测均值匹配 (pmm) 算法确保仅出现估算值,这些值确实在数据集中。例如,这很有用,其中只有像 0,1,2,3 这样的整数值出现在数据中(并且两者之间没有值)。其他算法不会这样做,因此在进行回归时,它们还将提供插值,如右图所示(因此它们将提供例如 1.1、1.3、...等插补值)这两种解决方案都可能存在某些缺点. 这就是为什么事后实际评估插补性能很重要的原因。在小鼠中有几个诊断图可以做到这一点。
推荐阅读
- ruby - 重定向后机架会话密钥不保留
- python - SHAP decision_plot 截断特征名称
- javascript - Jest TypeError:无法读取 null 的属性
- spring-boot - 将当前密码字段添加到 CAS 密码更改请求
- python-3.x - Pygame“太空侵略者”按键取消左右同时点击时的移动
- c# - 为什么不使用 TryTakeFromAny 而不是 TakeFromAny
- javascript - 我需要一个代码,它可以在加载网站时用另一个图像(由我选择)替换图像
- python - 给定一个数字列表,如何创建总和的所有组合并返回这些总和的列表
- rust - 获取 n 字符向量的所有组合
- css - 导航栏按钮一键失效