首页 > 解决方案 > UnicodeDecodeError:“utf-8”编解码器无法解码位置 2 中的字节 0xd1:无效的继续字节

问题描述

基本上,我使用 pandas 读取 csv 文件来分隔一列,其中包含格式为“dd/mm/yy hh”的“日期 + 小时”。

我在这里得到了帮助,试图编写一个脚本来将列分隔为 2 个不同的列。

首先,这是数据集的样子:

在此处输入图像描述

联合字段是“FECHA”,我设法在一些 csv 文件上运行此代码:

import pandas as pd,os
sal = pd.read_csv('C:/Users/drivasti/Documents/002_Script_Separa_Fecha_Hora/Anexo2_THP_UL.csv')

df=sal.join(sal['FECHA'].str.partition(' ')[[0, 2]]).rename({0: 'DATE', 2: 'HOUR'}, axis=1)

df.to_csv('C:/Users/drivasti/Documents/002_Script_Separa_Fecha_Hora/Anexo2_THP_UL_2.csv',index=False)

他们工作得很好,如下所示:

在此处输入图像描述


但是,当我尝试运行另一个 csv 文件时遇到了这个错误(请注意,我每次必须运行它时都会更改文件的名称,但它们都是 csv 文件):

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 2: invalid continuation byte


现在我在这里尝试了一些答案,但没有一个有帮助:

UnicodeDecodeError: 'utf-8' codec can't decode byte
'utf-8' codec can't decode byte 0xdb in position 1:


任何人都可能知道如何将其解析为 UTF-8?还是“FECHA”领域的问题?

标签: pythonpandasdataset

解决方案


推荐阅读