encoding - R 中字符编码混乱的正确数据帧(Windows-1252 vs. UTF-8 vs. ISO-8859-1)
问题描述
我真是一团糟!
由于某种原因,一些数据在 R 中被错误地读取。结果所有特殊字符都被弄乱了。然后数据被处理,交给其他人,用不同的软件一次又一次地处理,......
因此,没有办法回到使用正确编码读取它的原始文件并重现它所发生的所有处理。该文件需要事后更正。
看起来该文件来自 Windows-1252,但使用 ISO-8859-1 读入 R。在某些时候,也可能涉及 UTF8。现在,'ö' 在 R 中看起来像 'ƒ?\u009d'(读取为 UTF-8),如果在 Excel (Windows-1252) 中打开,则像 'â€'。
解决方案
推荐阅读
- swift - 使用格式“DD”时,日期格式化程序未显示正确的日期
- objective-c - Xcode 10.2 Swift 错误:函数类型不能在 Objective-C 中表示,除非它们的参数和返回值可以
- wordpress - 不要在 WordPress 循环中返回重复的标题
- client-server - 在本地客户端服务器场景中发送和接收加密和签名的文档
- c - 错误:将“float”传递给不兼容类型“const char *”的参数
- javascript - Javascript中的递归Floodfill错误 - 不会继续递归?
- python - 无法在 Python 中拆分元组对象:“元组”对象没有“拆分”属性
- python - 如何搜索包含字符串的数组,并创建一个只有整数的新数组
- angular - ngControl 的未指定名称属性的表单控件没有值访问器
- winapi - 在 dbghelp.h 的上下文中,“内联”是什么意思?