python - UnicodeDecodeError utf-8 无法解码字节
问题描述
combine_csv = pd.concat([pd.read_csv(f) for f in all_filenames]) 无法正常工作
UnicodeDecodeError:“utf-8”编解码器无法解码位置 12 中的字节 0xff:无效的起始字节
整个代码如下:
import os
import glob
import pandas as pd
os.chdir("S/Last Processed Data")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])
combined_csv.to_csv( "combined_csv.csv", index=False, encoding='utf-8-sig')
解决方案
读取文件时需要传递编码参数:
combined_csv = pd.concat([pd.read_csv(f, encoding=...) for f in all_filenames])
如果utf-8
不起作用,请尝试ISO-8859-1
。
推荐阅读
- pyspark - 如何在 PySpark 中创建数据框列表或数据框字典?
- javascript - 如何导入包并以角度调用函数?
- python - 注销功能提供 RecursionError 错误
- microsoft-graph-api - Microsoft Graph API 站点搜索返回已删除的站点
- c - C中的赋值混淆
- kotlin - Stopping an infinite flow
- python - 带有'datetime.date'的pandas Dateframe中的TypeError
- html - 为什么在chrome浏览器中的CSS文件有问题?
- node.js - 部署 AWS Lambda S3 教程代码时出错
- google-cloud-platform - 如何查看或列出数据流作业 VPC/网络?