text - 有没有办法恢复像“Ch�Teau”这样的错位编码?
问题描述
我正在使用这个加拿大邮政编码集合。令我失望的是,许多法语名称被错误编码,因此“Trois-Rivières”显示为“Trois-Rivi�Res”等等。这似乎是数据库本身的错误,而不是我的文本编辑器/浏览器的错误。
有没有办法正确编码这些重音标记?它们太多了,无法手动查找和替换。
解决方案
这些词似乎包含那个替换问号,'\uFFFD'
。这意味着数据丢失,但也是查找这些值的简单标记。
用错误的字符串作为主键创建一个表。修复可能比想象的要容易。在示例中,R
在 qm 而不是之后的大写r
可能源于单词大写。i?r
很有可能i e-gauche r
。
然后进行正则表达式替换即可。
但是,重新导入更正的数据库转储可能更容易。修复不需要在 SQL 中。
推荐阅读
- java - Spring Security - 需要添加自定义cookies
- php - VBA Excel、PHP MySQL - 数据循环、转置、范围、列表视图、数组
- javascript - 无法在 chrome 中加载音频文件
- c# - 加载不同版本的同一个dll,依赖也不同?
- c++ - Compiling a C++ program from cmd using TCC in turbo c++
- python - pymysql execute() - 返回值不等于受影响的行数
- javascript - 用于重定向到新页面的 JavaScript 动画按钮
- regex - 如何使用 Javascript 排除 Regex 中的某些字符串?
- apache-spark - 遍历 Spark DataFrame 需要大量时间并且失败并出现错误 OutOfMemoryError: GC 开销限制超出
- java - Apache Flink:从 HDFS 读取文件