google-cloud-data-fusion - Google Data Fusion 从存储桶中的多个子文件夹读取文件,需要放置在侧子文件夹中的另一个文件夹中
问题描述
例子
sameer/student/land/压缩文件 sameer/student/pro/未压缩文件
sameer/employee/land/压缩文件 sameer/employee/pro/未压缩文件
在上面的示例中,我需要从存在于不同子目录中的所有 LAND 文件夹中读取文件,并且需要对其进行处理并将它们放置在 PRO 文件夹中的相同子文件夹中。
为此,我从源和接收器中获取了两个 GCS 节点。
在 GCS 源中,我提供了路径 gs://sameer/ ,它正在从所有子文件夹中读取文件并将它们合并到一个文件中,并将其放置在接收器路径中。
例外输出所有文件都应该放在我从中获取的子目录中。
它可以通过为每个文件夹单独运行管道来实现异常输出
我期待这可以通过单个管道运行来实现
解决方案
推荐阅读
- sql-server - 从库存表中,找出库存为零的两个日期之间的日期
- javascript - 异步错误处理包装器不起作用
- error-handling - 如何正确打印来自 `luaL_dostring()` 的错误消息?
- docker - 在 kubernetes 上安装 kamel 时我必须通过什么注册表?
- java - 当一个项目使用JDK配置时,会加载JDK中的哪个.jar文件?
- reporting-services - 如何为显示报告参数值的 NoRowsMessage 构建 SSRS 表达式?
- java - Java getResourceAsStream 出现问题,对包的工作方式感到困惑
- python - 加密包导入失败
- html - 什么时候让许多 div 变得讨厌?
- sql-server - 如何使用 formcollection 将数据插入数据库