apache-nifi - FlowFile 内容与 FlowFile 属性的最佳实践
问题描述
我刚刚开始使用 Apache NiFi,我很好奇是否有任何关于使用 FlowFile 的属性与内容的最佳实践。目前,我已将其设置为从 RabbitMQ 队列读取 JSON 消息,将 JSON 解析为属性并将这些属性用于下游处理。这行得通,但我觉得它在 JSON 解析后基本上未使用 FlowFile 的内容,我想知道我是否遗漏了一些东西。许多处理器似乎更倾向于使用属性,但是主要使用属性进行处理有什么缺点吗?
在我的用例中,RabbitMQ 消息将是一个新文档可用的事件,并且我正在构建的流程将具有基于文档类型的分支逻辑,以通过 NLP 流程从文档中提取数据。目前,我将文档文本存储为和属性,但我想知道是否有任何大小因素需要考虑属性。有些文档可能有数百页,因此有很多文本。
谢谢!
解决方案
推荐阅读
- python - np.array 未传递具有相同第一维 = 值错误的数组
- python-3.x - 致命的 Python 错误:initfsencoding: 无法加载文件系统编解码器 ModuleNotFoundError: No module named 'encodings' visual studio code
- javascript - 如果在字符串中找到超链接,则只允许特定域
- css - 有没有办法删除这个自定义字体的字体粗细?
- python - 使用 ruamel.yaml 在 yaml 文件的第一行添加了不希望的缩进和破折号
- r - 根据名称数据库通过名称的部分匹配和重命名来汇总行
- python - 双摆RK4
- python - 这两个返回语句有什么区别
- mongodb - spring data mongo upsert 嵌入对象数组和主文档
- apache - Tomcat 集群设置中的身份验证和会话复制