首页 > 解决方案 > 使用 dask 在值计数中包含缺失值 (NaN)

问题描述

达斯克暴露dask.dataframe.Series.value_counts。与其对应的 pandas(此处)相比,dask 实现似乎不支持该参数dropna。我错过了什么吗?如果这确实是不可能的,那么规范的解决方法是什么?

标签: pythonpandasdask

解决方案


所以你可以使用DataFrameGroupBy.size

df.groupby('col').size()

推荐阅读