marklogic - 从 Apache Nifi 运行 MarkLogic Data Hub 5 流
问题描述
我成功使用 Nifi 中的 PutMarkLogic 处理器将 JSON 文档插入 MarkLogic。这将创建纯 JSON 文档。如何在摄取期间添加数据中心信封?如何在摄取期间启动数据中心 5 流?
根据https://marklogic.github.io/nifi/run-data-hub-input-flow上的 MarkLogic Nifi 文档,这可以在 PutMarkLogic 处理器中使用“服务器转换”=“ml:sjsInputFlow”属性和自定义属性 trans:flow-name 和 trans:entity-name。但这会导致 MarkLogic 中出现“无效强制”错误:
2020-03-10 17:09:44.967 Notice: XDMP-AS: $src as node() -- Invalid coercion: null as node()
2020-03-10 17:09:44.967 Notice:+in /data-hub/4/impl/flow-lib.sjs, at 56:16, in getFlow() [javascript]
2020-03-10 17:09:44.967 Notice:+in /marklogic.rest.transform/mlSjsInputFlow/assets/transform.sjs, at 25:21, in transform() [javascript]
...
在堆栈跟踪数据集线器中提到了 4。那么也许 MarkLogic Nifi 文档已经过时了?
解决方案
这是针对 DHF 4 流量的。使用“mlRunIngest”作为转换名称,使用“trans:flow-name”指定流程名称,使用“trans:step”指定步骤编号。
推荐阅读
- tensorflow - tf.keras.Model.predict 和调用返回不同的结果
- php - 根据下拉选择填充多个 sql 查询
- html - 如何在 ComponentResolveFactory 中动态移除组件
- c# - 如何验证文本框中的邮政编码并将相应的州/城市输出到各自的标签
- android - 如何使用 URL 将 base64string 数据发布到 webview?
- php - 使用 PHP-FFmpeg 创建图像视频缩略图
- assembly - 将寄存器值移动到节数据中的内存变量
- python - 如何在返回响应之前等待 python lambda 处理程序中的所有事件?
- python - 如何将参数发送到_init_
- javascript - 添加到 href URL 字符串