python-3.x - 用xml格式在s3上写动态帧
问题描述
标题我想用 xml 格式在 s3 上编写我的动态框架。我想获取我的 df 的一个 xml 文件。我尝试了这些行,但得到了 xml 文件的不同部分。请问谁能帮我解决这个问题???
datasink4 = glueContext.write_dynamic_frame.from_options(frame = df, connection_type = "s3", connection_options = {"path": "s3://datalaketest1/temp"}, format = "xml", transformation_ctx = "datasink4")
解决方案
在这种情况下,您需要重新分区为 1,因此它只会创建 1 个输出文件:
repartitioned_df = df.repartition(1)
datasink4 = glueContext.write_dynamic_frame.from_options(frame = repartitioned_df, connection_type = "s3", connection_options = {"path": "s3://datalaketest1/temp"}, format = "xml", transformation_ctx = "datasink4")
推荐阅读
- markdown - 如何在 Gatsby 项目中渲染 markdownRemark 中的链接
- python - seaborn:如何在 X 轴上添加第二级标签
- azure - 有没有办法使用逻辑应用将数据加载到 Azure 数据湖存储第 2 代?
- python - 绘制具有 8 个特征的 k-最近邻图?
- c# - Linq 'join ... into' 不返回连接对象
- firebase - Cloud Firestore 中的服务器端锁
- java - 使用 AWS Java SDK,是否可以取消绑定到堆栈的角色?
- java - 如果无法验证,如何检查测试用例
- c - c中的隐式转换和显式转换
- xamarin - 如何在visual studio中使用或重新安装android模拟器