python - 使用 Beautifulsoup 获取特定属性
问题描述
我想使用 beautifulsoup 从 HTML 标记中提取属性。怎么做 ?
例如:
<div class="search-pagination-top clearfix mtop ">
<div class="row"><div class="col-l-4 mtop pagination-number" tabindex="0"
aria-label="Page 1 of 15 "><div>Page <b>1</b> of <b>15</b> </div></div>
如何从“aria-label”属性中获取文本?
我尝试使用 select() 但没有帮助。
解决方案
您可以像字典一样提取属性值。使用钥匙aria-label
前任:
from bs4 import BeautifulSoup
html = """<div class="search-pagination-top clearfix mtop ">
<div class="row"><div class="col-l-4 mtop pagination-number" tabindex="0"
aria-label="Page 1 of 15 "><div>Page <b>1</b> of <b>15</b> </div></div>
"""
soup = BeautifulSoup(html, "html.parser")
print( soup.find("div", class_="col-l-4 mtop pagination-number")["aria-label"] )
输出:
Page 1 of 15
推荐阅读
- c++ - OpenMP 4.5 任务依赖和执行顺序
- python - 如何快速检查字符串是否正确?- Python
- python - 为什么追加覆盖列表?
- spring-data - 带有连接的 Spring 数据 jpa querydsl 投影
- python - 如何从另一个类正确访问一个类的 StringVar() - Python - tkinter
- javascript - 如何在javascript中的“function printOut(){}”中编写代码?
- azure - 使用 Azure 数据工厂和 OData 连接器从 Google-Facebook 获取数据
- python - Django Celery 周期性任务示例
- airflow - 我想将 Python Fabric 与我的自定义 Operator 一起使用,我应该如何在工作人员上安装 Fabric?
- java - Spring boot metrics 显示 HikariCP 连接创建计数为 1,当 HikariCP 调试日志的连接总数为 2 时