首页 > 解决方案 > 打印出 dask 系列/数据框的简单方法?

问题描述

在 pandas 中,有很多方法,如 head、tail、loc、iloc 可用于查看内部数据,但每当我在 dask 上调用这些方法之一时,我得到的只是:

Dask DataFrame Structure:
              Close
npartitions=1
               bool
                ...
Dask Name: try_loc, 9 tasks

无论我之前是否调用 .compute() 。如何查看 dask 数据框/系列中的数据?

我正在使用 Visual Studio Code 1.38.1、python 3.7、dask 2.13.0

标签: pythondask

解决方案


head、tail 和 compute 都返回正常的 Pandas 数据帧,这些数据帧应该以熟悉的方式打印到屏幕上。这是一个简单的例子:

In [1]: import dask                                                             

In [2]: df = dask.datasets.timeseries()                                         

In [3]: df                                                                      
Out[3]: 
Dask DataFrame Structure:
                   id    name        x        y
npartitions=30                                 
2000-01-01      int64  object  float64  float64
2000-01-02        ...     ...      ...      ...
...               ...     ...      ...      ...
2000-01-30        ...     ...      ...      ...
2000-01-31        ...     ...      ...      ...
Dask Name: make-timeseries, 30 tasks

In [4]: df.head()                                                               
Out[4]: 
                       id     name         x         y
timestamp                                             
2000-01-01 00:00:00  1014  Michael  0.326006 -0.247279
2000-01-01 00:00:01  1001    Laura  0.429982 -0.545960
2000-01-01 00:00:02  1003      Bob -0.454010  0.096530
2000-01-01 00:00:03   964    Wendy  0.939114  0.826197
2000-01-01 00:00:04  1008   Xavier  0.035316  0.793430

推荐阅读