首页 > 解决方案 > 隔离在 pd.Excelread 中出现错误的 Excel 文件

问题描述

我有来自某个来源的多个文件(500)。我正在尝试以下代码:

big_frame = pd.DataFrame()

for file in os.listdir():
    if file.endswith('.xls'):
        df = pd.read_excel(file)
        #df = df.apply(pd.to_numeric, errors='coerce')
        big_frame = big_frame.append(df,ignore_index=True)

我收到以下错误:

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x00\x00\x00\x00\x00\x00\x00\x00'

我想列出导致此错误的文件。谁能指导我如何过滤出导致此错误的文件,以便可以使用正确的文件构建数据框。

或者我可以在我的代码中进行任何更改来处理此错误。

谢谢

标签: pythonexcelpandasdataframe

解决方案


推荐阅读