首页 > 解决方案 > 数据洞察正则表达式 - 排除 www

问题描述

使用 Google Data Studio,我有一个正则表达式;

REGEXP_EXTRACT( Page , '.*/(.*)/' )

是我目前使用的。页面变量正在重新创建为最后一页路径,但我需要确保页面不包含“www”。

欢迎任何想法或建议。

标签: regexgoogle-data-studiore2

解决方案


REGEXP_EXTRACT如果您可以接受没有预期结果的空匹配项,则可以利用仅返回捕获组值的事实。因此,您可以在不使用捕获组的情况下在需要获取的选项之前指定一个选项。

REGEXP_EXTRACT( Page , '.*www.*|.*/(.*)/' )

此模式将匹配并使用其中的字符串www,如果没有www,则触发第二种选择,如果有两个斜杠,您将获得两个最右边斜杠之间的值。

如果您还需要跳过http其中包含的字符串,只需替换www(?:www|http)、非捕获组匹配wwwhttp

REGEXP_EXTRACT( Page , '.*(?:http|www).*|.*/(.*)/' )

推荐阅读