r - 我不能使用 prodNA 函数在 R 中估算数据吗?
问题描述
我试图估算一些丢失的变量。
数据的一些信息是:
实例数:690
属性数:15+类属性
属性信息:
A1: b, a. A2: continuous. A3: continuous. A4: u, y, l, t. A5: g, p, gg. A6: c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff. A7: v, h, bb, j, n, z, dd, ff, o. A8: continuous. A9: t, f. A10: t, f. A11: continuous. A12: t, f. A13: g, p, s. A14: continuous. A15: continuous. A16: +,- (class attribute)
缺失属性值:37 例 (5%) 有一个或多个缺失值。特定属性的缺失值是:
A1: 12 A2: 12 A4: 6 A5: 6 A6: 9 A7: 9 A14: 13
#install.packages("missForest")
library(missForest)
datos2 <- prodNA(datos, noNA = 0.05)
datos2 <- missForest(datos, verbose = TRUE)
summary(datos2)
datos2$ximp
但结果是在数据中得出的,而不是估算的。
解决方案
你犯了一个很简单的错误:
但结果是在数据中得出的,而不是估算的。
看你的代码:
#install.packages("missForest")
library(missForest)
datos2 <- prodNA(datos, noNA = 0.05)
datos2 <- missForest(datos, verbose = TRUE)
summary(datos2)
datos2$ximp
您向missForest 提供datos
而不是datos2
(带有您创建的缺失数据的data.frame)。如果您将完整的 data.frame 提供给missForest
() ,那么它只会为您提供完整的数据。
这将解决您的问题:
datos2 <- missForest(datos2, verbose = TRUE)
推荐阅读
- python - Django 无法将 ForeignKey 插入数据库:这是错误,MultiValueDictKeyError
- android - 没有找到可以自动化 Chrome '53.0.2785' 的 Chromedriver
- elixir - 如何将十进制转换为整数?
- sql-server - 在 SQL 中求和 json 对象
- cocos2d-x - 如何从 CallFunc 获取更新的参数?(cocos2d-x V3.0)
- python - TensorFlow 的 Print 或 K.print_tensor 不在损失函数中打印中间张量
- c# - 如何在 azure applicationInsights 中创建自定义列
- html - 如何使用引导程序在徽标和菜单项之间添加一些文本?
- c# - 如何在 WPF 桌面应用程序中使用 Geolocator.RequestAccessAsync
- angular - Angular 6 - 如何向 vendor.js 添加另一个库