首页 > 解决方案 > 在 R 中的 multidplyr 中使用 distinct() 时出错

问题描述

我在使用 R 中的 multidplyr 对少数核心进行计算时遇到问题。我有一个数据,我给它一个数字(数据将按数字分组,数字 1 的数据将被感知到集群 1 等),如下面的代码:


cores <- numCores - 4

group <- rep(1:cores, length.out = nrow(dane))

dane <- bind_cols(tibble(group), dane)

cluster <- multidplyr::new_cluster(cores)

dane <-
  dane %>%
  group_by(group) %>%
  partition(cluster) 

此外,我发送到每个将计算库、其他值和函数的集群。

数据拆分并发送到集群后,我想开始计算并收集结果:

dane %>% select() %>% distinct() %>% ...

但不幸的是我有这个错误,我不知道如何解决这个问题[而不是 distinct(),我使用唯一但其他错误显示。]

“命令'UseMethod(“distinct”)'中的错误:'distinct'的不适用方法应用于类对象“multidplyr_party_df””

标签: rcluster-computingdistinctmultidplyr

解决方案


推荐阅读