python - href类的python美丽汤问题
问题描述
我有这个代码:
...code ommited...
tda = soup.findAll('a', attrs={'href': re.compile("https://link/browse/[A-Z]{2,4}-[0-9]{1,7}"), "class":"external-link"}) # Find all A tag with specific href
...code ommited...
first_end_tag_index = a_tag_as_str.find(">")
a_tag_as_str_index = "".join(html_as_list).find(a_tag_as_str[:first_end_tag_index + 1])
...code ommited...
OUTPUT:
first_end_tag_index: 90
a_tag_as_str_index: -1
当我的锚像
"<a href="https://link/browse/DDD-0001" class="external-link" rel="nofollow">DDD-0001</a>"
我得到-1就像
"<a class="external-link" href="https://link/browse/DDD-0001" rel="nofollow">DDD-0001</a>"
我得到> -1
我错过了什么?为什么漂亮的汤希望类在 href 之前?
有什么方法可以让它不检查那里的班级吗?
解决方案
推荐阅读
- angular - 我收到错误 TS2345:“数字”类型的参数不可分配给“字符串”类型的参数
- excel - 输入框公式
- c - 为什么'printf'在gcc中什么都不打印?
- c# - C# 使用在具体类声明中引用自身的泛型
- google-sheets - 为什么 =Importrange() 会在 Google 表格中导致 #name 错误?
- jquery - Does Bootstrap version 3.4 compatible with JQuery version 3.4?
- c# - 如何使用 PostgreSQL 获得类似 LINQ-to-SQL 的功能?
- react-native - 如何将 Shopify 应用程序集成到 React Native 中
- python - Tkinter 获取图像以跟随光标与先前的移动
- java - 将一个简单的 Java 库发布到 Maven