python - 如何去除特殊字符
问题描述
我已从https://stats.oecd.org/Index.aspx?DataSetCode=MEI_ARCHIVE复制文本“修订分析数据集 - 年度经济指标”并导出到 CSV 文件,但显示一些无效字符“–”在 .csv 文件中。
import pandas as pd
df = pd.DataFrame(['Revisions Analysis Dataset – Infra-annual Economic Indicators'])
df.to_csv(r"D:\Sunil_Work\temp.csv")
导出文件中的特殊字符如下:
0,Revisions Analysis Dataset – Infra-annual Economic Indicators
我已经包含encoding = 'utf-8',但没有运气,请帮忙。
df.to_csv(r"D:\Sunil_Work\temp.csv", encoding = 'utf-8')
解决方案
有时utf-8
不适用于所有类型的编码。
尝试以下方法:
encoding=utf-8-sig
encoding=utf-16
推荐阅读
- html - 主机reveal.js幻灯片(.html)[Jupyter notebook export]作为非本地服务器上的网页
- orientdb - 从 OrientDB 中的 unionall 中删除重复的结果
- django - django中表单字段的动态数量
- java - javac:即使在设置 HOME_PATH 之后也找不到文件
- php - Laravel 中的注册表单重定向到自身而不创建用户实例
- php - 将不带扩展名的文件夹内容显示为链接
- angular - 如何在 URL 的 Angular 参数中包含 .equals?
- javascript - 在动画期间使 Click 事件不可用
- android - 无法跟踪从另一个线程呈现的帧
- gooddata - 具有多个标签的 GoodData 属性