pyspark - AWS Glue-如何在 S3 中将动态帧编写为 .txt 文件并使用“|” 作为分隔符
问题描述
我想将动态框架作为文本文件写入 S3 并使用“|” 作为分隔符。
如何修改下面的代码,以便 Glue 将框架保存为 .txt 文件并使用“|” 作为分隔符。
glue_context.write_dynamic_frame.from_options(
frame = frame,
connection_type = "s3",
connection_options = {"path": outpath},
format = "csv")
解决方案
您可以将 DynamicFrame 转换为 spark 数据帧,并使用 spark 写入选项 sep 将其与分隔符一起保存。
df=frame.toDf()
df.write.option("sep","|").option("header","true").csv(filename)
推荐阅读
- javascript - 如何根据所选日期在 datepicker 365/366(闰年)中设置 maxdate
- java - 我无法从另一个目录导入包
- r - 概括 tidyjson::spread_values
- java - API Gateway Lambda 集成 SelectionPattern 不匹配
- ruby - 追踪未知 Sidekiq 进程的来源
- docker - 如何将自定义 DNS 区域文件内容添加到运行在 127.0.0.11 的 docker 嵌入式 DNS 服务器?
- php - 热修复“警告:mysqli_stmt::bind_param():类型定义字符串中的元素数与绑定变量数不匹配”?
- r - 使用 read.xlsx 时未使用的参数
- database - 如何在vba中填充文本框
- kotlin - 未找到/丢失 AndroidX 可穿戴包