首页 > 解决方案 > 熊猫读取excel:ValueError

问题描述

我正在尝试使用以下命令将 exec 文件读入 pandas(0.24.1):

import pandas as pd
file_df=pd.read_excel('c:\\temp\\file.xlsx')

我收到此错误: ValueError: invalid literal for int() with base 10: ''

可能的原因/解决方案是什么?该文件是在 excel 中打开的 xlsx 文件。如果我在 excel 中打开文件并保存它而不更改任何内容,我注意到一件奇怪的事情,Pandas 读取保存的文件没有错误,但不是原始文件!(我用的是Win10 office 365)

标签: pythonexcelpandas

解决方案


我假设您的总体意图是调查导致 pandas 无法读取 xlsx 文件的原因,您不需要实际的解决方案,因为只需重新保存文件即可解决问题。

我的建议如下。将工作版本保存为 fixed.xlsx

  1. 将 .xlsx 重命名为 .rar 或 .zip,这样你就有了 file.zip 和 fixed.zip
  2. 将存档解压缩到文件夹和固定文件夹。
  3. 将文件夹与软件进行比较(我使用 Beyond Compare,但任何其他都可以)
  4. 我怀疑差异会在 /xl/worksheets 中,所以先比较这个文件夹。
  5. 您可能不理解 xml 文件之间差异的含义。如果是这种情况,请在此处发布差异,有人会(希望)向您解释文件之间的实际差异是什么

希望我有所帮助


推荐阅读