首页 > 解决方案 > 如何从数据框中的特定列中删除重复值?

问题描述

我想删除数据框某些列值中的重复文本。

像这样..

在此处输入图像描述

我应该怎么办?

标签: rregexdataframeduplicates

解决方案


base R中,我们可以将 'originaltext' 列拆分为,后跟零个或多个空格 ( \\s*),然后遍历listwith ,通过不带空格的 ingsapply获取unique值和paste它们collapse

df1$result <- sapply(strsplit(df1$originaltext, ",\\s*"),
       function(x) paste(unique(x), collapse=""))

推荐阅读