amazon-s3 - NiFi ListS3 处理器包含父文件路径作为流文件
问题描述
我在 s3 中的文件
s3://my_bucket/my_path/data/category/myfile.txt
使用带有存储桶的 ListS3 处理器并传递“my_path/data/category/”作为前缀,我将获得两个流文件:
“s3://my_bucket/my_path/data/category/myfile.txt” 和 “s3://my_bucket/my_path/data/category/”
这里的第二个不是实际的流文件,而只是它的路径。
如何更改我的处理器配置以仅获取“myfile.txt”条目?
此外,FetchS3 似乎正在拾取它并将其发送到下一个处理器“ExecuteScript”,该处理器正在修改文件的内容。
这个ExecuteScript处理器显然失败了,但没有记录它,相反,它只是卡在队列中。
如何让它将其发送到故障路径而不是卡在队列中?
解决方案
找到了解决方案!ListS3 存储桶中有一个“分隔符”属性,我需要在其中包含“/”作为分隔符。这用于排除 Amason S3 的父目录。
推荐阅读
- opencart - 电子邮件订单 opencart 中的库存状态
- python - Python pandas在另一列的元素列表中查找一列的元素
- angular - 如何在 spec.test 文件中定义“component.QRcode”
- discord.js - 识别链接中的部分并在嵌入中重新格式化它们
- python - 对于我的凯撒密码,它说索引超出范围,而不是?
- python - 频域上的同态滤波(Python 和 OpenCV)
- ibm-midrange - IBM I 系列 AS400 CPYAUDJRNE
- css - 为什么图像在 div 内被翻译?
- python - 员工用户在没有明确分配的情况下无权访问管理站点
- python - 使用直接 SQL 查询访问 Django 中的数据库