r - 在 R 中编码正确的语言
问题描述
我有一个 Excel-CSV 文件,如下所示:
`! ВО ВЛÐСТИ ÐÐÐ’ÐЖДЕÐИЯ (ПЛÐСТ.) D,0`,40
我尝试用正确的语言对文件进行编码。
如果我阅读文件,它看起来像这样:
read.csv("myfile.csv",
stringsAsFactors = F)
`! ВО ВЛÐСТИ ÐÐÐ’ÐЖДЕÐИЯ (ПЛÐСТ.) D,0`,40
如果我尝试使用“UTF-8”对文件进行编码,它看起来像这样:
read.csv("myfile.csv",
encoding = "UTF-8",
stringsAsFactors = F)
! <U+0412><U+041E> <U+0412><U+041B><U+0410><U+0421><U+0422>
目标是获得下面的编码(我在 excel 中使用 65001 unicode (utf-8))
!Якутск Орджоникидзе, 56 фран,0
如果我尝试使用 excel 使用 65001 unicode (utf-8) 生成的格式对文件进行编码,我也会得到与上述相同的结果。
structure(list(shop_name = c(" 56 Ñ„Ñ\200ан", ""), shop_id = c(0L,
NA)), class = "data.frame", row.names = c("!ЯкутÑ\201к ОÑ\200джоникидзе",
"!ЯкутÑ\201к ТЦ \"ЦентÑ\200альный\" Ñ„Ñ\200ан,1"
))
解决方案
推荐阅读
- node.js - 将 JavaScript 对象从 EJS 传递到 Express
- google-apps-script - 如何从外部脚本执行 Google App 脚本
- android - 为什么 Google Fit 不返回所有重量?
- docker - 如何修复 Docker-Compose(Hyperledger Fabric)中的“Compose 文件 './docker-compose.yaml' 无效,因为”错误?
- c# - 为 Remotewebdriver 设置语言 - BrowserStack 端点
- node.js - 如何获取集群上所有可用服务的列表?
- html - 如何一次在多个文件中添加一个html元素
- javascript - 从 WEB 页面读取客户端机器注册表
- elasticsearch - elasticsearch script_score中的多个Math.pow不起作用
- javascript - 使用 Jest Enzyme 测试时如何测试子组件中的按钮单击?