python - 在dask中,熊猫中是否有类似“ .loc ”的方法?
问题描述
我想绘制天文物体的 Ra 和 Dec。我使用的是 Pandas,但我获得了更多数据 ~ 500,000 个样本量。这是一个python代码(有效......)
#assigning ra and dec of all objects that are classified as galaxies
l_rad_galaxy = df.loc[df["class"] == "GALAXY", "ra"]
b_rad_galaxy = df.loc[df["class"] == "GALAXY", "dec"]
现在为了处理 500,000 个样本大小,我使用 Dask 来读取 csv 文件。但是当我运行上面的代码时,会产生以下错误 -
KeyError: 'class'
数据中有一个特征“类”。我想仅从“类”为“GALAXY”的样本中提取 Ra 和 Dec 的所有值。
上述代码的 Dask 替代方案是什么?
PS:我尝试过使用getitem但它也不起作用。