dask - 代码非常慢而且几乎永无止境 - Dask 数据框将列分配给字典
问题描述
我有 1M dask 数据框行。我正在尝试将字典值分配给数据框的新列。
df = df.assign(c=lambda x: {"a": x.a, "b": x.b})
print(df.compute())
实现这一目标的最佳方法是什么?
PS:我正在尝试使用进度条来跟踪进度,其中代码真的快到 67% 并且挂断了。我的 CPU 和内存消耗得非常少,但代码正在运行,感觉好像永远不会完成。
解决方案
也许是以下?(未经测试)
df["c"] = df.apply(lambda row: {"a": row.a, "b": row.b})
推荐阅读
- xpath - 如何根据xpath中同一行中另一个td的文本选择一个td值
- reactjs - ReactJS - 使用 useState 挂钩维护数值
- c# - .Where(x=> x.listFoos.Count() > 1) 是否计算所有子元素?
- azure-active-directory - Azure AD B2C:Microsoft Graph API 错误 - 属性“移动”不作为声明的属性或扩展属性存在
- php - 自己的预订脚本
- pyspark - 我想知道 spark-redshift 库是开源/免费使用还是必须通过 Databricks 获得许可
- c# - 如何实现 Elasticsearch Suggester?
- php - 从 Artisan Command 调用控制器时发送后 Guzzlehttp 请求方法发生更改
- flutter - Visual Studio Code - Flutter:禁用自动中断
- excel - 在 Excel VBA 中设置全局变量