首页 > 解决方案 > 在R中将文本更改为小写,在文本挖掘中保持首字母大写

问题描述

如何使用 R 将全文更改为小写但保留大写的首字母缩写词?我需要它来进行文本挖掘和使用 udpi 包。我当然可以使用大写字母,但无论如何在使用小写字母时保留大写首字母缩写词?

tolower('NASA 是一家美国公司')。

tolower('NASA IS A US COMPANY')
tolower('NASA IS A US COMPANY')

Expected: NASA is a US company

Actual: nasa is a us company

标签: r

解决方案


我们可以这样做:测试是输入:

paste(lapply(strsplit(test," "),function(x) ifelse(x %in% toupper(tm::stopwords()),
                                              tolower(x),x))[[1]],collapse=" ")
[1] "NASA is a US COMPANY"

推荐阅读