首页 > 解决方案 > 相同的种子,PL/R 与 R,不同的结果(随机森林)

问题描述

我有一个 R 函数,它接受一些包含缺失值的输入数据,使用随机森林插补来插补这些值(通过 RandomForest 包中的 rfImpute 函数),然后通过 RF 重要性计算来确定变量的相对重要性(通过 ranger来自游侠包)。该功能有种子2018。

当我使用 R 和 set.seed(2018) 运行该函数时,我得到一组结果。当运行完全相同的函数、完全相同的输入数据并在 PL/R(使用 Navicat)中使用完全相同的种子时,结果是不同的。

我很难理解是什么导致了这个问题,因为两者之间的一切都完全相同(除了一个是 R,另一个是 PL/R)。对于某些输入数据集,结果是等价的,但对于其他数据集则不然。问题可能是什么?

注意:我无法提供简单的示例,因为我的数据是机密的。

标签: rpostgresqlrandomnavicatplr

解决方案


推荐阅读