python - 如何从python中的csv文件中删除特殊字符?
问题描述
您好我正在尝试从 csv 文件中删除特殊字符,但没有得到满意的结果。你能帮我怎么做吗?
例子:
ÃœþÑÂúòð
Óþрþô áðýúт-ßõтõрñурó
我得到的这些特殊字符之王。
我正在使用下面的 python 代码保存文件-
df = pd.read_csv(r"D:\Users\SPate233\Documents\cleanData-JnJv2.csv", low_memory=False)
df.to_csv(r"D:\Users\SPate233\Documents\cleanData-JnJv2_new.csv", encoding='utf-8-sig', index=False)
解决方案
我不确定,但你可以试试Code
下面给出的片段:-
基本上,我DataFrame
从你的Data
. CSV
因此,对于使用特殊字符上传。encoding
指定类型很重要。所以,我使用了ISO-8859-1
这种encoding
技术。因为ISO-8859-1
是一系列单字节编码方案,用于表示可以在 127 到 255 范围内表示的字母表。
了解更多关于
ISO-8859-1
点击这里
# Import all the important Libraries
import pandas as pd
# Read 'Data'
df = pd.read_csv('temp_data.csv', encoding = "ISO-8859-1")
# Print a few records of data with special characters
df
# Output of Above Cell:-
Data
0 ÃœþÑÂúòð
1 Óþрþô áðýúт-ßõтõрñурó
看完之后DataFrame
。我们可以前进,去除特殊字符的过程。code
如下所述:-
# Removal of Special Characters
df['Data'] = df['Data'].map(str).apply(lambda x: x.encode('utf-8').decode('ascii', 'ignore'))
# Print Cleaned data
df
# Output of Above Cell:-
Data
0
1 -
如您所见,我们已删除所有特殊字符。因此,我们可以将其存储Result
到CSV
:-
# Store clean data into 'CSV' Format
df.to_csv(r'cleaned_temp_data.csv', encoding = 'utf-8-sig', index = False)
希望这个,解决方案可以帮助你。
推荐阅读
- python - 检查字符串中的 id 是否存在于另一个列表中
- angular - 如何以角度获取和显示实时用户通知?
- php - PHP颜色未被确认
- dji-sdk - 在姿态模式下以速度移动无人机
- xml - Ansible - XML 命名空间
- google-apps-script - 获取 Gsuite google drive 上的文件夹列表,在 Google Sheet 上按字母顺序列出
- javascript - 在浏览器中打开新标签的问题
- sql-server - 将 SQL Server 位类型导入 MS Access 数据库
- python - 使用适用于 Python 的 Bot Framework SDK v4 初始化并向 Microsoft Teams 频道发送消息
- windows - 从批处理文件中的变量中删除最后一个字符