amazon-s3 - 为什么使用 pyspark 从 s3 读取时数据文件头作为数据行读取
问题描述
我正在使用以下代码从 s3 存储桶中读取数据。
dynamic_frame_rates= glue_context.create_dynamic_frame_from_options(connection_type = "s3", connection_options = {"paths": ["s3://path/Master.csv"]}, format = "csv",header:"true")
但是文件标题仍然是作为普通数据行读取的,列名是 col0,col1,col2。
解决方案
推荐阅读
- javascript - jQuery 获取整个输入元素,包括它的值
- javascript - 使用 socketio 重定向页面
- c# - 通过反射获取属性,但只有用户在 c# 中制作了属性
- wordpress - wp_remote_post 响应正文受保护
- xslt - XSLT - 如何获取节点的名称值?
- java - Couchbase 5 memcache 存储桶未刷新
- python - Mysql - 如何将skip_networking设置为关闭?
- mongodb - 如何实现猫鼬模型之间的多对多关系
- amazon-web-services - 如何从公共 s3 url 获取整个对象列表
- wso2 - WSO2 esb 验证器调解器未显示确切失败