首页 > 解决方案 > $split() (jsonata) 函数中的正则表达式给出“正则表达式匹配零长度字符串”为什么?

问题描述

我有一个如下所示的字符串文本,每当有新行并以日期 dd/mm/yyyy 开头时,我想拆分文本。

我在 javascript 中使用 jsonata $split() 函数。但是,我收到一个 jsonata 错误,因为以下“正则表达式匹配零长度字符串”。请帮助我如何解决这个问题。

text = "22/03/2012 intro 20/10/2019\n" + 
       "22/03/2012 body\n" + 
       "more body 22/04/2020\n" +
      "22/03/2012 stuff more stuff"


$split(text , /\\r?\\n(?=(?:0[1-9]|[12][0-9]|3[01])[- \\/.](?:0[1-9]|1[012])[- \\/.](?:19|20)\\d\\d)/))
//I want the output to be [ "22/03/2012 intro 20/10/2019",
//                           "22/03/2012 body more body 22/04/2020",
//                           "22/03/2012 stuff more stuff] 
// But my output now is [ "22/03/2012 intro 20/10/2019",
//                           "22/03/2012 body/n + more body 22/04/2020",
//                           "22/03/2012 stuff more stuff]                          

标签: javascriptregexparsingsplitjsonata

解决方案


利用

$split($replace(text, /(\r?\n)\s*\+\s*(?=\d{2}[- \/.]\d{2}[- \/.]\d{4})|\r?\n\s*\+\s*/g, '$1'), /\r?\n/)

证明

第一个$replace删除加号和换行符,并在必要时替换为行尾。

一个$split用回车+换行或换行分开。


推荐阅读