首页 > 解决方案 > pandas.read_csv() 不加载特殊字符

问题描述

标签: pythonpandasjupyter-notebook

解决方案


您看到的是解释 UTF-8 字符的 Windows-1252 编码。UTF-8 中的€ 是 E282AC,对应于 Windows-1252 á ‚ ¬。我不认为这是熊猫问题,因为您的文件已使用 utf-8 解码器正确解码,否则应该有错误。由于您提到您在 jupyter notebook 中加载它,因此显示的编码由您的浏览器决定。通常,jupyter 会发送一个Content-Type标头并指定字符集为 UTF-8。但是,如果 jupyter 太旧或浏览器太旧,它们可能不会使用此属性(据我所知,如果您不将 IE 编码设置设置为自动,IE 11 将忽略此属性)。因此,浏览器将尝试以 Windows-1252 编码来解释这些字符。


推荐阅读