python - 如何在 Pandas 中使用 quotechar 从 DAT 文件中读取和写入 thorn 字符?
问题描述
请在下面查看我的代码。代码按预期工作,但输出 DAT 文件缺少 þ(拉丁小写字母刺)字符。
import pandas as pd
inputdat = "C:/Downloads/Python/SAMPLEDATA.dat"
outputdat = "C:/Downloads/Python/Output.dat"
colnames = ["ID", "Company", "Employee", "Salary", 'Years']
df = pd.read_csv(inputdat, names = colnames, header = None, skiprows = 1, encoding='UTF-8', quotechar='\xfe', sep='\x14', engine='python')
filter = ['UID_001', 'UID_002']
df.loc[df.ID.isin(filter), ['Salary', 'Years']] = ""
df.to_csv(outputdat, quotechar='\xfe', sep='\x14', index=False, encoding='UTF-8')
如何确保 thorn 符号包含在输出 dat 中?
示例输入:https ://imgur.com/vUWCRfF
当前输出:https ://imgur.com/sUlsy87
期望的输出:https ://imgur.com/UnX0j43
注意:对于以图像形式发布示例输入和输出,我深表歉意。否则,分隔符和引号字符未正确显示。
解决方案
看起来您面临的问题是没有添加引号(刺字符),因为默认的引用规则是csv.QUOTE_MINIMAL
. 看起来你想要csv.QUOTE_ALL
:
import csv
df.to_csv(outputdat, quotechar='\xfe', sep='\x14', quoting=csv.QUOTE_ALL,
index=False, encoding='UTF-8')
推荐阅读
- java - 使用流和原始类型进行 Java 类型推断
- php - Symfony 自定义身份验证提供程序在请求重叠时注销
- javascript - 使用 Graphql 并做出反应,我无法从默认导出访问功能
- string - 你可以用字符串替换一些东西吗?
- scala - 队列的两种实现中速度差异的解释
- c - C链表removeLast使用指针
- javascript - 这是 url 编码的正确方法/此服务器是否正确处理解码?
- java - BufferedReader readLine 未使用 HttpURLConnection 到达流的末尾
- python - 从 csv 列中提取最常见的组合
- c# - 从基本视图模型动态分配视图模型中的属性