首页 > 解决方案 > R 中字符编码混乱的正确数据帧(Windows-1252 vs. UTF-8 vs. ISO-8859-1)

问题描述

我真是一团糟!

由于某种原因,一些数据在 R 中被错误地读取。结果所有特殊字符都被弄乱了。然后数据被处理,交给其他人,用不同的软件一次又一次地处理,......

因此,没有办法回到使用正确编码读取它的原始文件并重现它所发生的所有处理。该文件需要事后更正。

看起来该文件来自 Windows-1252,但使用 ISO-8859-1 读入 R。在某些时候,也可能涉及 UTF8。现在,'ö' 在 R 中看起来像 'ƒ?\u009d'(读取为 UTF-8),如果在 Excel (Windows-1252) 中打开,则像 'â€'。

标签: encodingcharacter-encodingspecial-charactersiso-8859-1windows-1252

解决方案


推荐阅读