首页 > 解决方案 > 在 R 中编码正确的语言

问题描述

我有一个 Excel-CSV 文件,如下所示:

`! ВО ВЛÐСТИ ÐÐÐ’ÐЖДЕÐИЯ (ПЛÐСТ.)         D,0`,40

我尝试用正确的语言对文件进行编码。

如果我阅读文件,它看起来像这样:

read.csv("myfile.csv",
           stringsAsFactors = F)

`! ВО ВЛÐСТИ ÐÐÐ’ÐЖДЕÐИЯ (ПЛÐСТ.)         D,0`,40

如果我尝试使用“UTF-8”对文件进行编码,它看起来像这样:

read.csv("myfile.csv",
               encoding = "UTF-8",
               stringsAsFactors = F)

! <U+0412><U+041E> <U+0412><U+041B><U+0410><U+0421><U+0422>

目标是获得下面的编码(我在 excel 中使用 65001 unicode (utf-8))

!Якутск Орджоникидзе, 56 фран,0

如果我尝试使用 excel 使用 65001 unicode (utf-8) 生成的格式对文件进行编码,我也会得到与上述相同的结果。

structure(list(shop_name = c(" 56 Ñ„Ñ\200ан", ""), shop_id = c(0L, 
NA)), class = "data.frame", row.names = c("!ЯкутÑ\201к ОÑ\200джоникидзе", 
"!ЯкутÑ\201к ТЦ \"ЦентÑ\200альный\" Ñ„Ñ\200ан,1"
))

标签: rwindowscsv

解决方案


推荐阅读