aws-glue - 是否可以通过传递给 from_catalog 的 groupFiles 以编程方式创建动态框架?
问题描述
我在 aws 论坛上发布了同样的问题,但鉴于从那里获得答案的糟糕体验,我在这里试试运气。
我有一个正在创建表格的爬虫和一个从该表格创建动态框架的粘合作业。我看到该页面https://docs.aws.amazon.com/glue/latest/dg/grouping-input-files.html提到 groupFiles 可以在表属性中指定或作为参数传递给 create_dynamic_frame.from_options 如果直接读取从s3。
此架构蓝图在我们的生产工作负载中的许多地方都使用过,因此我正在寻找上述替代方案。我想知道我是否可以将相同的 groupFiles:"inPartition" 属性传递给 create_dynamic_frame.from_catalog 的 Additional_options 属性,它是否可以工作?
aws 文档对此含糊不清,我在任何地方都看不到有人这样做的例子。
编辑: AWS 文档暗示这是可能的,但是文档页面相互链接的方式并不能完整或明确地描述它们的功能。因此问题。
解决方案
additional_options
不幸的是,没有真正记录在案。您必须直接询问 AWS Support。我前段时间联系了他们,如果他们可以使用您可以放入 additional_options 的所有可能值更新他们的文档,他们说他们会努力解决这个问题。
推荐阅读
- kubernetes - 无法使用 multus 向 pod 添加第二个接口 - minikube
- glsl - Vulkan:统一缓冲区的奇怪性能
- c++ - 如何在 Qt Creator 中获取所有编译单元的编译器警告
- mysql - SQL 连接和多对多查询
- python - 使用 Python OpenCV 测量微观粒子的费雷特直径
- php - fopen(http://127.0.0.1:3000/.well-known/mercure/):无法打开流:无法解析地址“0”
- javascript - 两个事件监听器重叠 Javascript
- c++ - [class.prop]/(3.7) 似乎与 [class.prop]/(3.7.3) 矛盾。我错过了什么?
- python - 在 Anaconda 提示符下运行 .py 文件时,如何使 matplotlib 图形标题包含在窗口中
- php - PHP 从另一个命名空间调用抽象类方法