首页 > 解决方案 > 如何去除特殊字符

问题描述

我已从https://stats.oecd.org/Index.aspx?DataSetCode=MEI_ARCHIVE复制文本“修订分析数据集 - 年度经济指标”并导出到 CSV 文件,但显示一些无效字符“–”在 .csv 文件中。

import pandas as pd
df = pd.DataFrame(['Revisions Analysis Dataset – Infra-annual Economic Indicators'])
df.to_csv(r"D:\Sunil_Work\temp.csv")

导出文件中的特殊字符如下:

0,Revisions Analysis Dataset – Infra-annual Economic Indicators

我已经包含encoding = 'utf-8',但没有运气,请帮忙。

df.to_csv(r"D:\Sunil_Work\temp.csv", encoding = 'utf-8')

标签: pythonpython-3.xpandasdataframe

解决方案


有时utf-8不适用于所有类型的编码。

尝试以下方法:

  1. encoding=utf-8-sig
  2. encoding=utf-16

推荐阅读