首页 > 解决方案 > Apify:PseudoUrl 正则表达式以匹配包含给定关键字的 url

问题描述

Apify PseudoUrl支持 JavaScript 样式的正则表达式来匹配 URL。

我尝试按照 RegEx 匹配包含特定关键字的所有 url -

//not working
http://www.example.com/[*foo*]

例如,如果一个网站有以下链接:

http://www.example.com/pages/
http://www.example.com/pages/bar

http://www.example.com/pages/foo/bar.html
http://www.example.com/pages/test-foo-test.html
http://www.example.com/pages/foo.html

正则表达式应匹配最后 3 个网址。但是,正则表达式不起作用。

标签: regexapify

解决方案


您需要检查foo域内容之后是否存在任何位置:

http:\/\/www\.example\.com\/.*foo

https://regex101.com/r/UlSb4w/2


推荐阅读