首页 > 解决方案 > 带有多行标题 xls 文件的 Pandas read_csv

问题描述

如何使用 pandas 读取以下 xls 文件的标题?

.xls 文件

DATE、BENCHMARK NAME 等所有列标题都在第 3 行,但百分位值“1ST (PERCENT)”在第 4 行。

当我尝试:

df = pd.read_csv(xls_url, skiprows=[0,1,7], header=3) # or header=[3,4]

我收到以下错误:

ParserError: Error tokenizing data. C error: Expected 1 fields in line 13, saw 2

标签: pythonpandas

解决方案


您不应该read_csv在 .xls 文件上使用。如果您将文件保存为 .csv,您可以看到 .csv 标头的外观,并且应该很简单。

否则使用read_excel文档)。它应该遵循以下原则:

pd.read_excel(xls_url, skiprows=3)

推荐阅读