首页 > 解决方案 > 正则表达式自定义表单

问题描述

我有这样的声明:

信用 电子存款/银行信用 有效 发布日期 日期 金额 交易详情 07/01 2,023,825.24 Stagecoach Sweep Credit 07/02 2,023,825.24 Stagecoach Sweep Credit 07/02 19,479.00 WT Fed#02868 E Trade Securities /Org=Etrade Securities LLC Srf# 8785491 070220 Trn 200702058382 Rfb# 07/03 2,042,191.24 Stagecoach Sweep Credit 07/06 2,042,191.24 Stagecoach Sweep Credit 07/07 2,042,191.24 Stagecoach Sweep Credit 07/08 2,042,191.24 Stagecoach Sweep Credit 07/09 2,042,191.24 Stagecoach Sweep Credit 07/10 2,042,191.24 Stagecoach Sweep Credit 07/13 2,042,191.24 Stagecoach Sweep Credit 07/14 2,041,936.79 Stagecoach Sweep Credit 07/15 2,041,936.79 Stagecoach Sweep Credit 07/15 61,683.50 WT Fed#02317 E Trade Securities /Org=Etrade Securities LLC Srf# 8824249 071520 Trn#200715067847

我需要创建一个正则表达式公式,它将在 mm/dd 格式之后提取和分离所有内容。

例子:

07/02 2,023,825.24 Stagecoach Sweep Credit 07/02 19,479.00 WT Fed#02868 E Trade Securities /Org=Etrade Securities LLC Srf# 8785491 070220 Trn#200702058382 Rfb#

那么该语句之后的下一行将是在该语句之后立即以 mm/dd 格式开始的行

07/03 2,042,191.24 驿马车一揽子积分 07/06 2,042,191.24 驿马车一揽子积分

由于我对正则表达式完全陌生,我不知道如何处理流程..

提前谢谢了,

标签: pythonregexstringalteryx

解决方案


这有点旧,但如果您没有找到解决方案,那么您可以在 Alteryx 中按照以下方式进行操作。

首先,确保您的字段大小足够大(您可以使用 Select)正则表达式,配置如下:

表达式:(\s\d\d/\d\d\s)

方法:替换

文本:\n$1

然后使用 Text to Columns: Delimiter (\n) and Split to Rows

如果您随后需要将同一日期的数据移动到同一行,那么您可以使用 Multi-Row,或者将日期拆分并使用 Summarize to Concatenate


推荐阅读