regex - 数据洞察正则表达式 - 排除 www
问题描述
使用 Google Data Studio,我有一个正则表达式;
REGEXP_EXTRACT( Page , '.*/(.*)/' )
是我目前使用的。页面变量正在重新创建为最后一页路径,但我需要确保页面不包含“www”。
欢迎任何想法或建议。
解决方案
REGEXP_EXTRACT
如果您可以接受没有预期结果的空匹配项,则可以利用仅返回捕获组值的事实。因此,您可以在不使用捕获组的情况下在需要获取的选项之前指定一个选项。
REGEXP_EXTRACT( Page , '.*www.*|.*/(.*)/' )
此模式将匹配并使用其中的字符串www
,如果没有www
,则触发第二种选择,如果有两个斜杠,您将获得两个最右边斜杠之间的值。
如果您还需要跳过http
其中包含的字符串,只需替换www
为(?:www|http)
、非捕获组匹配www
或http
:
REGEXP_EXTRACT( Page , '.*(?:http|www).*|.*/(.*)/' )
推荐阅读
- unix - 如何在 WSL 上使用 dd?
- perl - Cwd.c:可加载库和 perl 二进制文件不匹配(获取握手密钥 0xdb00080,需要 0xde00080)
- ionic-framework - Ionic 3 本机地理围栏插件无法在 xcode 9 上运行,因为地理围栏插件不支持 swift 3
- html - how to define two pipes in the same component
- javascript - Highlighting with php generated checkbox form
- vbscript - 自动填充表单 IE VBScripting
- .net-core - 为什么 NLog 会忽略项目目录中的 NLog.config 文件?
- javascript - Remove last option value from multiple select element using jQuery
- mysql - MySQL query parameters in a Pentaho CE dashboard
- mongodb - 如何在给定 Mongo GridFS 长度的情况下找到视频的持续时间?