首页 > 解决方案 > csv文件数据清洗流程

问题描述

在此处输入图像描述请参阅随附的屏幕截图。我想删除所有包含“未命名”列中条目的行。我知道该列可以删除,data.drop(data.columns[27], axis=1, inplace=True)但它不会删除整行

import pandas as pd
import numpy as np

data = pd.read_csv('/home/syed/ML-Notebook/FL-P1/DATASET_FRAUDE.csv',
                 engine='python',
                 encoding=('latin1'),
                 parse_dates=['FECHA_SINIESTRO','FECHA_INI_VIGENCIA','FECHA_FIN_VIGENCIA','FECHA_DENUNCIO'])


#data.drop(data.columns[27], axis=1, inplace=True)

print(data.info())

标签: pythonpandasdata-analysisdata-cleaning

解决方案


df = df[df['Unnamed: 27'].astype(str).map(len) >0]
df

删除列:

df = df.loc[:, ~df.columns.str.contains('^Unnamed')]

推荐阅读