首页 > 解决方案 > R读取具有正确瑞典字符编码'ANSI'(windows base)的.txt文档

问题描述

我正在使用基于 Windows 的机器。我有一个 test.txt 文档,它的编码为“ANSI”,里面有瑞典字符。我希望我可以将这些信息读给 R 进行进一步分析。有什么建议吗?

我目前的解决方案是我需要将 .txt 文档另存为具有“utf_8”编码的新文档,然后使用下面的代码。但是希望有一个建议可以直接以正确的格式读取“ANSI”。谢谢!

该文件看起来像: 在此处输入图像描述

文件格式: 在此处输入图像描述

如果我将 .txt 重新保存为“utf-8”格式,则该代码有效

dftxt <- readr::read_delim('./data/text_Briljant2.txt', 
                       delim = '\t', skip = 15,
                       locale = locale('se', encoding = 'UTF-8'),
                       col_names = F) %>% select(-c(X5, X6))

似乎提供可重复的样本是不可行的。但如果你让我知道我可以在哪里上传我愿意提供的文件。

感谢您的任何建议。

标签: rencodingreadr

解决方案


dftxt <- readr::read_delim('test.txt', 
                           delim = '\t', skip = 15,
                           locale = locale('se', encoding = 'ISO8859-1'),
                           col_names = F) %>%
  select(-c(X5, X6))

推荐阅读