python - 如何做正则表达式从 HTML 文件中提取字符串
问题描述
我仍然无法弄清楚如何提取这样的链接:
http: example.com/AA-HDCM-300B.pdf
因为我想提取以 ."AA-HDCM-300B"
开头的产品部件号"AA-"
。
有人知道提取码是什么吗?
解决方案
import re
url = 'dview.com/IDVIEW/Products/Cameras/Covert/assets/IV-PC229XP.pdf'
result = re.findall('(IV.*)\.', url)
输出:
IV-PC229XP
推荐阅读
- c++ - 包含其他结构的向量的结构的序列化失败
- python - 尝试解决类型错误以将整数转换为索引值
- javascript - 如何用图像填充多边形?
- php - 如何在 preg_match_all 中仅打印第 2 组的值,而不使用数组和循环
- react-native - 为什么自定义函数在屏幕渲染期间在 react-native-navigation 抽屉组件中自动执行
- html - Node.js/Express.js - 如何将远程 HTML 文件呈现给客户端?
- vhdl - 如何从用户 VHDL 获取多个输入
- c - 使用宏转换结构中整数字段的字节序
- operating-system - 我们是否可以在无限或荒谬的数量下获得 0 页面错误率?
- python - pandas 调整 Excel 表的大小以匹配较大的表以进行比较