首页 > 解决方案 > 在dask中,熊猫中是否有类似“ .loc ”的方法?

问题描述

我想绘制天文物体的 Ra 和 Dec。我使用的是 Pandas,但我获得了更多数据 ~ 500,000 个样本量。这是一个python代码(有效......)

#assigning ra and dec of all objects that are classified as galaxies
l_rad_galaxy = df.loc[df["class"] == "GALAXY", "ra"]
b_rad_galaxy = df.loc[df["class"] == "GALAXY", "dec"]

现在为了处理 500,000 个样本大小,我使用 Dask 来读取 csv 文件。但是当我运行上面的代码时,会产生以下错误 -

KeyError: 'class'

数据中有一个特征“类”。我想仅从“类”为“GALAXY”的样本中提取 Ra 和 Dec 的所有值。

上述代码的 Dask 替代方案是什么?

PS:我尝试过使用getitem但它也不起作用。

标签: pythonpandasdataframedask

解决方案


推荐阅读