首页 > 解决方案 > 熊猫,从 xlsx 读取时,我得到充满 nan 的数据框

问题描述

我正在从 Excel 文件“.xslx”中读取,它由 3 列组成,但是当我从中读取时,我得到一个充满 nans 的 DF,我在 Excel 中检查了表格,它由普通单元格组成,没有公式没有超链接。

我的代码:

data = pd.read_excel("Data.xlsx")
df = pd.DataFrame(data, columns=["subreddit_group", "links/caption", "subreddits/flair"])
print(df)

这是excel文件:

Excel 文件。

这是输出:

输出

标签: pythonexcelpandasdataframe

解决方案


函数的column参数pd.Dataframe()不会在结果数据框中设置列名,而是从原始文件中选择列。

请参阅熊猫文档

当数据没有它们时用于结果帧的列标签,默认为 RangeIndex(0, 1, 2, ..., n)。如果数据包含列标签,将改为执行列选择。

因此,您不应提供column参数,并且在读取文件后,重命名数据框的列:

df = pd.DataFrame(data)
df.columns = ['subreddit_group', 'links/caption', 'def']

推荐阅读