首页 > 解决方案 > FlowFile 内容与 FlowFile 属性的最佳实践

问题描述

我刚刚开始使用 Apache NiFi,我很好奇是否有任何关于使用 FlowFile 的属性与内容的最佳实践。目前,我已将其设置为从 RabbitMQ 队列读取 JSON 消息,将 JSON 解析为属性并将这些属性用于下游处理。这行得通,但我觉得它在 JSON 解析后基本上未使用 FlowFile 的内容,我想知道我是否遗漏了一些东西。许多处理器似乎更倾向于使用属性,但是主要使用属性进行处理有什么缺点吗?

在我的用例中,RabbitMQ 消息将是一个新文档可用的事件,并且我正在构建的流程将具有基于文档类型的分支逻辑,以通过 NLP 流程从文档中提取数据。目前,我将文档文本存储为和属性,但我想知道是否有任何大小因素需要考虑属性。有些文档可能有数百页,因此有很多文本。

谢谢!

标签: apache-nifi

解决方案


推荐阅读