python-3.x - Python / Selenium - 如何循环通过hrefs
问题描述
网址:https ://www.ipsos.com/en-us/knowledge/society/covid19-research-in-uncertain-times
我想解析 HTML 如下:
我想获取 < li > 元素和突出显示的文本中的所有href。我试过代码
elementList = driver.find_element_by_class_name('block-wysiwyg').find_elements_by_tag_name("li")
for i in range(len(elementList)):
driver.find_element_by_class_name('blcokwysiwyg').find_elements_by_tag_name("li").get_attribute("href")
但是该块没有返回。
谁能帮我上面的代码?
解决方案
我想它会为您获取所需的内容。
import requests
from bs4 import BeautifulSoup
link = 'https://www.ipsos.com/en-us/knowledge/society/covid19-research-in-uncertain-times'
r = requests.get(link)
soup = BeautifulSoup(r.text,"html.parser")
for item in soup.select(".block-wysiwyg li"):
item_text = item.get_text(strip=True)
item_link = item.select_one("a[href]").get("href")
print(item_text,item_link)
推荐阅读
- nativescript - nativescript相机中的自定义布局以及android上的自定义布局根本不可见
- sql - SQL Server:从第一行减去最后一行
- javascript - 当触发孩子在javascript中未定义的点击事件时
- php - 在 @lang() 中打开 PHP 标签
- javascript - 从 AWS Lambda 层的 ffmpeg 输出中删除逗号
- python - PyCharm 一次又一次地调用 Packaging_tool.py 列表
- php - PHP 不会忽略 html 标签
- bmp - QB64中如何复制屏幕的一部分并将其保存为位图或PNG文件?
- java - 从 Web 服务器 Java 运行 .exe
- java - 如何在不禁止谷歌的情况下搜索关键字?