首页 > 解决方案 > 使用 Scrapy 和 BeautifulSoup 进行网页抓取

问题描述

<h2 class="result-item-name" data-nid="117" data-localisation="25.88872, -80.12488">
  Bal Harbour    </h2>

大家好,我正在尝试收集 'data-nid' 和 'data-localisation' 但是当我编写代码时:

'geocoordinates':['class','result-item-name','data-localisation']

我总是得到一个无响应。

你们能帮帮我吗?我是 BeautifulSoup 的新手,我对它并不放心。

非常感谢 !

标签: pythonbeautifulsoupscrapy

解决方案


BeautifulSoup您可以使用键值访问属性。就像字典一样

前任:

from bs4 import BeautifulSoup
html = """<h2 class="result-item-name" data-nid="117" data-localisation="25.88872, -80.12488">Bal Harbour    </h2>"""

soup = BeautifulSoup(html, "html.parser")
h2 = soup.find("h2", class_= "result-item-name")
print(h2["data-nid"])
print(h2["data-localisation"])

输出:

117
25.88872, -80.12488

推荐阅读