首页 > 解决方案 > R:如何将各种类型的表格转换为文本列以进行导出

问题描述

在此处输入图像描述

我有 2 列数据,在从 Excel 加载的表中:ID、BeforeConv 分别包含数字和文本。将此数据从 Excel 加载到 R Studio 后,我对列 BeforeConve 复制应用到 RStudio 中的新列进行了一些基于 tm_map 的文本清理:AfterConv

This is my code:
x <- read_excel(file.choose())
corpus<-Corpus(VectorSource(x$BeforeConv))
corpus<-tm_map(corpus,tolower)
x$AfterConv<-data.frame(text = sapply(corpus, as.character)) //<-here in R  studio data displayed correctly yet
write.csv(x=x, file="R2test.csv") //<-now the data displaced 

我的问题是,在 R Studio 中,我看到转换正确(见下图)

在此处输入图像描述

...当导出到 CSV 或 XLSX 时,最后一列 (AfterConv) 显示完全混乱的数据(见下文)。我做错了什么以及如何解决?

在此处输入图像描述

如果我能看到正确的代码来正确转换最后一列以正确地将其与两个现有列一起导出到 Excel 或 CSV,那就最好不过了。

标签: rexcelmultiple-columnscorpus

解决方案


推荐阅读