python - 将具有列中对象的数据框插入雪花
问题描述
我正在设计一个 ETL 管道来将数据从 MongoDB 加载到 Snowflake。
find()
通过通用命令从集合中提取数据- 将 ObjectId 类型转换为字符串
- 将光标转换为 DataFrame
- 在雪花库中使用
write_pandas
将数据框插入雪花表
但是,我收到一个错误Expected a bytes object, got a 'dict' object", 'Conversion failed for column origin with type object
。我假设它抛出一个错误,因为我的列之一是一个对象。是否可以将该列类型设置为 Variant,以便 Snowflake 将其存储为这样?
另外,这是最好的方法吗,有没有更好的方法来设计 etl 管道?
解决方案
推荐阅读
- python - 我有一个关于为多项式逼近创建 N x N 矩阵的问题
- java - Hibernate 中是否有任何注释来定义实体类中 postgres 的数据类型?
- php - PHP - 我的表单中有 971 个复选框,我正在尝试将复选框数据作为 post 方法发送,但我只得到 952 个
- firebase - 使用 Firebase Cloud Function 向特定 UID 发送通知
- powerbi - 在度量中选择特定日期
- php - Codeigniter 未定义的方法'getGet'.intelephense(1013)
- azure - Azure DataFactory 中的分页与证书身份验证
- typescript - 有没有办法从与 API 网关挂钩的 AWS Lambda 生成 API 文档?
- c - VS 代码每次在输出中显示 % 符号如何解决?
- google-sheets - 如何将前缀和后缀文本添加到数组公式中的部分文本