python - 如何在我正在抓取的 div 中抓取元素?
问题描述
我无法在 div 中打印元素。所以这是我要抓取的标签
div class="page-box house-lst-page-box" comp-module="page" page-url="/ershoufang/miyun/pg{page}" page-data="{"totalPage":73," curPage":1}"
我希望我的代码打印 totalPage 中的整数,即 73。
提前致谢!
解决方案
尝试:
import json
from bs4 import BeautifulSoup
html_doc = """<div class="page-box house-lst-page-box" comp-module="page" page-url="/ershoufang/miyun/pg{page}" page-data="{"totalPage":73,"curPage":1}"><a class="on" href="/ershoufang/miyun/" data-page="1">1</a><a href="/ershoufang/miyun/pg2" data-page="2">2</a><a href="/ershoufang/miyun/pg3" data-page="3">3</a><span>...</span><a href="/ershoufang/miyun/pg73" data-page="73">73</a><a href="/ershoufang/miyun/pg2" data-page="2">下一页</a></div>"""
soup = BeautifulSoup(html_doc, "html.parser")
data = soup.select_one("div[page-data]")["page-data"]
data = json.loads(data)
print("Total page:", data["totalPage"])
印刷:
Total page: 73
推荐阅读
- react-native - 未调用 React Native ErrorUtils 全局处理程序
- python - 为什么不能在继承multiprocessing.process的类中的__init__方法下初始化cuda模型?
- java - java - 映射以存储键和多种类型的值
- reactjs - React.js:将这种数组格式转换为 JSON
- javascript - 在 iframe 问题中传递 URL 参数
- javascript - 用子状态替换父状态。父级按钮
- c# - 如何将部分传递给布局中的部分?
- c++ - 具有对数刻度的 QwtPlotZoomer 问题
- java - 出现错误“非法尝试将非集合映射为 @OneToMany、@ManyToMany 或 @CollectionOfElements”
- azure - Azure - 基于 YAML 的管道中的自定义条件