首页 > 解决方案 > Pandas read_excel 删除空标题下的列

问题描述

我有一个 Excel 文件,其中 A1、A2、A3 为空,但 A4:A53 包含列名。

在“R”中,当您读取该数据时,A1、A2、A3 的列名将是“X_1,X_2,X_3”,但使用pandas.read_excel它时会跳过前三列,从而忽略它们。问题是每个文件中的列数是动态的,因此我无法解析列范围,也无法编辑文件并为 A1、A2、A3 添加“虚拟名称”

标签: python-3.xpandas

解决方案


使用参数skip_blank_lines=False,像这样:

pd.read_excel('your_excel.xlsx', header=None, skip_blank_lines=False)

这个stackoverflow问题(最终)为我指明了正确的方向: Python Pandas read_excel doesn't identify null cell

pandas.read_excel文档不包含任何关于此的信息,因为它是关键字之一,但您可以在此处的一般 io 文档中找到它:http: //pandas.pydata.org/pandas-docs/stable/io .html#io-read-csv-table


推荐阅读