首页 > 解决方案 > dask:袋子上的 groupby 显示出意外的行为

问题描述

我正在阅读https://tutorial.dask.org/02_bag.html上的 dask 教程,并对 groupby + starmap 在包上的行为感到惊讶:

截图 Dask 教程

为什么在第一个单元格的结果中有多个具有相同键的条目?作者似乎也没有预料到:他们说第二个单元格产生相同的结果。它没有。

groupby 的定义有什么变化吗?如果这种行为是预期的(只是不是我),它是否记录在某处?我尝试使用从序列创建的包来重现此问题,但未能成功。

标签: pythondask

解决方案


推荐阅读