首页 > 解决方案 > 如何删除R中列中的某些文本

问题描述

我正在尝试使用 R 从我的数据中删除某些文本。

我有一列包含像'S'这样的html语言,我正在尝试删除它们。

我尝试使用以下代码并得到错误。

df1 <- removeWords(df, '<root><header><nt>S</nt><rd>')

错误消息说

 Error in UseMethod("removeWords", x) : 
  no applicable method for 'removeWords' applied to an object of class "c('tbl_df', 'tbl', 'data.frame')"

我不确定那里出了什么问题。

标签: rtm

解决方案


根据 'tm' 包的文档,removeWords() 的第一个参数应该是“字符或文本文档”。您正在向它传递一个数据框,这不是函数所期望的类。数据框中的字符向量似乎是第一个参数。

df = data.frame(col1 = c("hello", "world"))
df$col1 <- as.character(df$col1)

removeWords(df$col1, "hello")

[1] ""      "world"

推荐阅读