首页 > 解决方案 > 在输出中,我没有从 Excel 获得完整的表格

问题描述

我刚开始使用 pandas,我想导入一个 31 行 11 列的 Excel 文件,但在输出中只显示了一些列,中间列用“....”表示,第一列“EST”开始的几个元素显示为“00:00:00”。

代码

import pandas as pd

df = pd.read_excel("C:\\Users\daryl\PycharmProjects\pandas\Book1.xlsx")

print(df)

输出

C:\Users\daryl\AppData\Local\Programs\Python\Python37\python.exe "C:/Users/daryl/PycharmProjects/pandas/1. Introduction.py"
                    EST  Temperature  ...    Events  WindDirDegrees
0   2016-01-01 00:00:00           38  ...       NaN             281
1   2016-02-01 00:00:00           36  ...       NaN             275
2   2016-03-01 00:00:00           40  ...       NaN             277
3   2016-04-01 00:00:00           25  ...       NaN             345
4   2016-05-01 00:00:00           20  ...       NaN             333
5   2016-06-01 00:00:00           33  ...       NaN             259
6   2016-07-01 00:00:00           39  ...       NaN             293
7   2016-08-01 00:00:00           39  ...       NaN              79
8   2016-09-01 00:00:00           44  ...      Rain              76
9   2016-10-01 00:00:00           50  ...      Rain             109
10  2016-11-01 00:00:00           33  ...       NaN             289
11  2016-12-01 00:00:00           35  ...       NaN             235
12            1-13-2016           26  ...       NaN             284
13            1-14-2016           30  ...       NaN             266
14            1-15-2016           43  ...       NaN             101
15            1-16-2016           47  ...      Rain             340
16            1-17-2016           36  ...  Fog-Snow             345
17            1-18-2016           25  ...      Snow             293
18            1/19/2016           22  ...       NaN             293
19            1-20-2016           32  ...       NaN             302
20            1-21-2016           31  ...       NaN             312
21            1-22-2016           26  ...      Snow              34
22            1-23-2016           26  ...  Fog-Snow              42
23            1-24-2016           28  ...      Snow             327
24            1-25-2016           34  ...       NaN             286
25            1-26-2016           43  ...       NaN             244
26            1-27-2016           41  ...      Rain             311
27            1-28-2016           37  ...       NaN             234
28            1-29-2016           36  ...       NaN             298
29            1-30-2016           34  ...       NaN             257
30            1-31-2016           46  ...       NaN             241

[31 rows x 11 columns]

Process finished with exit code 0

标签: python-3.xpandas

解决方案


要回答有关仅显示几列和“...”的问题:

所有列都已正确摄取,但您的屏幕/控制台不够宽,无法以“打印”方式一次输出所有列。这是正常/预期的行为。

Pandas 不是 Excel 等电子表格可视化工具。也许有人可以建议一种工具,用于在 Python 的电子表格格式中可视化数据帧,例如在 Excel 中。我想我见过人们在Spyder中可视化电子表格,但我自己不使用它。

如果要确保所有列都在那里,请尝试使用list(df)or print(list(df))

要回答您关于 EST 格式的问题:

看起来您有一些数据清理工作要做。这是数据科学中的典型工作。我不确定如何最好地做到这一点 - 我还没有在日期/日期时间方面工作太多。但是,这是我看到的:

  • 前几个项目也有时间戳,可能格式为 HH:MM:SS
  • 它们的格式为 YYYY-MM-DD
  • 在索引第 18 行,日期中有 / 而不是 -
  • 其余行的格式为 M-DD-YYYY

read_csv的文档中有一个选项可以自动处理这些问题。它被称为“ parse_dates”。如果您打开该选项pd.read_csv('file location', parse_dates='EST'),则可能会打开 EST 列的日期解析器,并可能解决您的问题。

希望这可以帮助!这是我对任何看到它可以随意编辑和改进它的人的第一个回答。


推荐阅读