dask - 替换 dask 数据框分区
问题描述
我可以用我单独创建的另一个具有相同行数和相同结构的 dask 数据框分区替换 dask 数据框分区吗?如果是,如何?
是否可以使用不同的行数?
解决方案
dd.concat
您可以使用该函数将分区添加到 Dask 数据帧的开头或结尾。
您可以通过切换到延迟对象,将延迟对象插入列表,然后切换回 dask 数据帧,在数据帧的任何位置插入新分区
list_of_delayed = dask_df.to_delayed()
new_partition = dask.delayed(pd.read_csv)(filename)
list_of_delayed[i] = new_partition
new_dask_df = dd.from_delayed(list_of_delayed, meta=dask_df._meta)
它可以有不同的行数,但必须有相同的列和数据类型
推荐阅读
- node.js - 引用当前目录之外的目录。“模块映射中不存在模块。” 在 node/react-native
- angular - 共享组件可以使用自己的私有@ngrx/store 吗?
- gmail - 无法连接到使用 2FA 保护的 Gmail SMTP
- firebase - Firebase 为上次更改添加时间戳的函数多次运行
- codenameone - 如何使用 cn1 文件选择器选择多个图像
- command-line - Atom platformio 不会运行 python
- phpmyadmin - phpmyadmin 卡在处理请求上
- java - 在执行阶段设置的 Android Test Instrumentation Runner 参数
- python - 将字符串“02-04-20189.45”转换为熊猫数据框中的日期时间类型
- django - 在 Django 上将用户从数据库迁移到另一个数据库