python - 使用 Scrapy 和 BeautifulSoup 进行网页抓取
问题描述
<h2 class="result-item-name" data-nid="117" data-localisation="25.88872, -80.12488">
Bal Harbour </h2>
大家好,我正在尝试收集 'data-nid' 和 'data-localisation' 但是当我编写代码时:
'geocoordinates':['class','result-item-name','data-localisation']
我总是得到一个无响应。
你们能帮帮我吗?我是 BeautifulSoup 的新手,我对它并不放心。
非常感谢 !
解决方案
BeautifulSoup
您可以使用键值访问属性。就像字典一样
前任:
from bs4 import BeautifulSoup
html = """<h2 class="result-item-name" data-nid="117" data-localisation="25.88872, -80.12488">Bal Harbour </h2>"""
soup = BeautifulSoup(html, "html.parser")
h2 = soup.find("h2", class_= "result-item-name")
print(h2["data-nid"])
print(h2["data-localisation"])
输出:
117
25.88872, -80.12488
推荐阅读
- sql - 如何选择包含特定子字符串的单词列表作为 SQL 查询(oracle)的一部分?
- python - 无法在python中将字符串解码为utf-8
- apache-kafka-connect - 当连接到雪花内部阶段时,我看到它连接到不同的数据库
- android-studio - 我在第一次运行颤振项目时收到错误!`完成错误:Gradle 任务 assembleDebug 失败,退出代码为 1`
- r - 使用现有行作为 geom_ribbon() min 和 max
- python - 三个嵌套的 for 循环会降低性能
- unity3d - Unity,我无法用 Tilemap 制作预制件
- react-native - 调试模式不激活断点
- javascript - 推送数组,但我不需要引号
- python - 自定义 python 函数将无法识别定义的变量