r - 如何使西里尔文数据集可识别?
问题描述
来自俄罗斯选举研究的一个数据集是用西里尔字母编写的,但 R 无法识别西里尔字母,而是显示一些奇怪的符号,如果我使用view(rusdata)
并且我想以某种方式转换此数据集,即西里尔字母被 R 识别。
这是我已经尝试过的以及对我没有帮助的:
rusdata <-read.spss("RES 2007-2008.sav", to.data.frame = TRUE)
Sys.setlocale(locale = "Russian")
view(rusdata)
Sys.setlocale(,"ru_RU")
view(rusdata)
Sys.setlocale("LC_CTYPE", "russian")
encoding = "utf-8"
view(rusdata)
Sys.setlocale("LC_CTYPE", "ru_RU.UTF-8")
view(rusdata)
我真的很欢迎你的帮助!
解决方案
您可以使用不同的包来试试运气,例如haven::read_sav
. 或者,我会stringi::stri_enc_detect
先检测编码。我假设您可以从 spss 复制部分文本。这是一个例子:
a <- "Статья 1;Все люди рождаются"
stringi::stri_enc_detect(a)
然后我会使用返回的编码stri_enc_detect
:
rusdata <-read.spss("RES 2007-2008.sav", to.data.frame = TRUE, reencode = "encoding goes here")
推荐阅读
- c# - .NET MongoDB 错误投影规范
- javascript - 网站可以禁止 javascript 在按钮上执行 .click() 吗?
- excel - 在 VBA 中使用“查找和替换”来替换多行?
- python - 到opencv的gstreamer管道
- javascript - 联系表格 7 mutistep - 返回第 1 步
- f# - 在 f# 中使用 dotnet 添加包安装的参考程序集
- excel - 按月划分的在职员工
- python - 在Python中两点之间的最小距离约束下从3D空间中采样N个点的有效方法
- python - 当我尝试使用 BeautifulSoup 从网站上抓取时,文本丢失
- php - 是否可以在laravel中的两个不同数据库的表之间设置外键?