首页 > 解决方案 > Nifi - 如何将数据放入 Hive 数据库?

问题描述

我正在构建一个 Nifi 流程以从 kafka 获取 json 元素并将它们写入 Have 表。

但是,关于处理器以及如何使用它们的文档很少甚至没有。

我打算做的是以下几点:

kafka consume --> ReplaceText --> PutHiveQL

在此处输入图像描述

消费卡夫卡主题做得很好。我收到一个 json 字符串。

我想提取 json 数据(使用 replaceText)并将它们放入配置单元表(PutHiveQL)中。

但是,我完全不知道如何做到这一点。文档没有帮助,也没有处理器使用的精确示例(或者我找不到)。

标签: hiveapache-nifi

解决方案


基本上你想将你的记录从 kafka 转换为 HQL 请求,然后将请求发送到 putHiveQl 处理器。

我不确定转换 kafka 记录 -> putHQL 可以通过替换文本来完成(接缝有点困难/棘手)。一般来说,我使用自定义 groovy 脚本处理器来执行此操作。


编辑

全球概览:

在此处输入图像描述

评估JsonPath

这会提取我的 Json 流文件的属性timestamp和属性,并将它们作为流文件的属性。uuid

在此处输入图像描述

替换文本

这将流文件字符串设置为空字符串并将其替换为replacement value我在其中构建查询的属性。

在此处输入图像描述


推荐阅读