首页 > 解决方案 > Apache Nifi:使用更新记录处理器替换列中的值

问题描述

我有一个 csv,它看起来像这样:

name,code,age
Himsara,9877,12
John,9437721,16
Razor,232,45

code我必须根据一些正则表达式替换列。我的逻辑显示在下面的 Scala 代码中。

if(str.trim.length == 9 && str.startsWith("369")){"PROB"}
else if(str.trim.length < 8){"SHORT"}
else if(str.trim.startsWith("94")){"LOCAL"}
else{"INT"}

我使用UpdateRecord处理器来替换code列中的数据。我添加了一个名为的属性/code,其中包含该值。

${field.value:replaceFirst('^[0-9]{1,8}$','SHORT'):replaceFirst('[94]\w+','OFF_NET')}

替换代码时有效

  1. 长度小于 8,带有“SHORT”
  2. 以“本地”开头的 94

我无法找到替换列中数据的方法,code当它等于 8 位并且以 0 开头时。此外,如果数据不属于上述任何条件,我该如何替换数据。(数据应该被替换的情况INT

希望您可以建议将工作流或值添加到更新记录中的属性中,以使上述两个替换发生。

标签: csvreplaceapache-nifi

解决方案


有一个lengthstartsWith功能。

${field.value:length():lt(8):ifElse(
  'SHORT', ${field.value:startsWith(94):ifElse(
  'LOCAL', ${field.value:length():equals(9):and(${field.value:startsWith(369)}):ifElse(
  'PROB', 'INT'
)})})}

我已经放置了换行符以便于识别功能,但它应该被删除。

顺便说一句,INT的意思是要替换一些字符串值?对困惑感到抱歉。


好吧,如果你只想正则表达式,你可以试试下面的代码。

${field.value
  :replaceFirst('[0-9]{1,8}', 'SHORT')
  :replaceFirst('[94]\w+', 'OFF_NET')
  :replaceFirst('369[0-9]{6}', 'PROB')
  :replace(${field.value}, 'INT')
}

推荐阅读