首页 > 解决方案 > 如何做正则表达式从 HTML 文件中提取字符串

问题描述

我仍然无法弄清楚如何提取这样的链接:

http: example.com/AA-HDCM-300B.pdf

因为我想提取以 ."AA-HDCM-300B"开头的产品部件号"AA-"

有人知道提取码是什么吗?

标签: pythonhtml

解决方案


import re

url = 'dview.com/IDVIEW/Products/Cameras/Covert/assets/IV-PC229XP.pdf'
result = re.findall('(IV.*)\.', url)

输出:

IV-PC229XP

推荐阅读