首页 > 解决方案 > 为什么 vecsets 包的 vunion 函数中的多个选项不适用于字符向量?

问题描述

当我运行代码时:

library(vecsets)
p <- c("a","b")
q <- c( "a")
vunion(p,q, multiple = TRUE)

我得到结果:

[1] "a" "b"

但我希望结果是

vunion(p,q, multiple = TRUE)
[1] "a" "b" "a"

我也不明白 vesect 包示例中提供的结果。该示例显示:

x <- c(1:5,3,3,3,2,NA,NA)
y <- c(2:5,4,3,NA)

vunion(x,y,multiple=TRUE) 
[1]  2  3  3  4  5 NA  1  3  3  2 NA  4

但是如果我们检查

length(x)+length(y); length(vunion(x,y))
[1] 18
[1] 12

我们得到不同的长度,但我认为它们应该是相同的。请注意,例如,5 只出现一次。

这里发生了什么?有人可以解释吗?

标签: r

解决方案


我认为vecset包文档(链接)很好地描述了这种行为:

base::union函数根据代数集理论删除重复项。vunion不会,因此返回的重复元素与一输入向量中的重复元素一样多(不是它们的输入之和。)简而言之,vunionvintersect(x,y) + vsetdiff(x,y) + vsetdiff(y,x).

确实,您必须仔细阅读。我已经强调了重要的部分。问题不在于字符向量与数字向量,而在于元素是否在同一个向量中重复。在以下示例中考虑 p1 与 p2。from 的结果将具有orvunion一样多的 a ,因此我们期望第一部分有 1 个“a”,第二部分有两个 a;两次我们都期望只有 1 个“b”: pq

library(vecsets)
q <- c("a", "b")

p1 <- c("a", "b")
vunion(p1, q, multiple = TRUE)
[1] "a" "b" 

p2 <- c("a", "a", "b")
vunion(p2, q, multiple = TRUE)
[1] "a" "b" "a"

推荐阅读