首页 > 解决方案 > R以不同的方式读取空白字符

问题描述

我从 csv 文件中导入了一些数据,R 似乎以不同的方式识别“看似”相同的字符。我下面的代码表明这是因为空白字符,但不知道如何解决这个问题。

print(mydata)
[1] "3COM CORP"
identical("3COM CORP", mydata)
[1] FALSE
"3COM"==str_sub(mydata,1,4)
[1] TRUE
"3COM "==str_sub(mydata,1,5)
[1] FALSE
> " CORP"==str_sub(mydata,5,9)
[1] FALSE
"CORP"==str_sub(mydata,6,9)
[1] TRUE
 " "==str_sub(mydata,5,5)
[1] FALSE

print(str_sub(mydata,5,5))
[1] " "

我刚刚尝试用实际的空格替换它,无论 mydata 中的空格是什么,并解决了它。但我仍然不明白是什么原因造成的。

badspace<-str_sub(mydata,5,5)

str_replace()
mydata2<-str_replace(mydata, badspace, " ")

identical("3COM CORP", mydata2)
[1] TRUE

标签: rstringcharacterstringr

解决方案


推荐阅读