python - Python 正则表达式
问题描述
如果有人能解释我的正则表达式有什么问题,我将不胜感激。我在正则表达式生成器上尝试过它工作正常,但是在我的笔记本电脑上编译时它打印出无。我得到了一个 html 链接,我想确定它的 href(reference)Here is the regex
r"(?<=\=\").{1,}(?=\W+?\s[t])"
例子:
<li id="n-mainpage-description"><a href="/wiki/Main_Page" title="Visit the main page [z]" accesskey="z">Main page</a></li>
错误:
解决方案
您可以使用否定的lookbehind 来获取href 的内容:
(?<=href=\")[^\"]+
(?<=href=\")
- 确保href="
在我当前位置之前[^\"]+
- 捕获不是双引号的所有内容
推荐阅读
- ace-editor - 王牌编辑器自定义模式 - 将突出显示规则添加到现有集合
- python - 如何保证子类不能在类外访问父类的方法?
- html - 使用正则表达式查找并用特定类替换打开和关闭 HTML 标记
- r - 如何将值转换为变量并根据它们的等级为它们分配一个值?
- swift - Swift:如何在句子中搜索关键字
- javascript - 括号 p5.js 无法加载声音:错误“请求状态为:0 ()”
- c# - RDLC 报告表输出显示在表外且无组织
- swift - 视图以模态显示而不是正常显示
- python - 使用 Python 进行图像压模
- python - 运行 pyautogui.size() 时出现“Xlib.xauth:警告,没有可用的 xauthority 详细信息”