首页 > 解决方案 > UnicodeDecodeError utf-8 无法解码字节

问题描述

combine_csv = pd.concat([pd.read_csv(f) for f in all_filenames]) 无法正常工作

UnicodeDecodeError:“utf-8”编解码器无法解码位置 12 中的字节 0xff:无效的起始字节

整个代码如下:

import os
import glob
import pandas as pd
os.chdir("S/Last Processed Data")

extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]

combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames])

combined_csv.to_csv( "combined_csv.csv", index=False, encoding='utf-8-sig')

标签: pythonpandas

解决方案


读取文件时需要传递编码参数:

combined_csv = pd.concat([pd.read_csv(f, encoding=...) for f in all_filenames])

如果utf-8不起作用,请尝试ISO-8859-1


推荐阅读