python - 如何在python中使用beautifulsoup提取href内容
问题描述
import requests
from bs4 import BeautifulSoup
page = requests.get('http://espn.go.com/nba/team/roster/_/name/atl/atlanta-hawks')
soup = BeautifulSoup(page.content, "html.parser")
player_list = soup.find_all(class_="Image__Wrapper")
#player_list = soup.find_all("tr")
print(player_list[1])
我得到的输出是
<div class="Image__Wrapper aspect-ratio--child"><img alt="https://a.espncdn.com/i/headshots/nba/players/full/3062667.png" class="" data-mptype="image" src="data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7" title="DeAndre' Bembry"/></div>
我只对获得 DeAndre' Bembry 感兴趣,我该如何提取它。我也有点困惑如何获取所有玩家姓名的列表。
解决方案
你可以试试
import requests
from bs4 import BeautifulSoup
page = requests.get('http://espn.go.com/nba/team/roster/_/name/atl/atlanta-hawks')
soup = BeautifulSoup(page.content, "html.parser")
player_list = soup.find_all(class_="Image__Wrapper")
#player_list = soup.find_all("tr")
print(player_list[1].img["title"])
输出
DeAndre' Bembry
并打印所有玩家
print([i.img["title"] for i in player_list if 0 < i.img["title"].count(" ") <= 3])
输出
["DeAndre' Bembry", 'Charlie Brown Jr.', 'Clint Capela', 'Vince Carter', 'John Collins', 'Dewayne Dedmon', 'Bruno Fernando', 'Brandon Goodwin', 'Treveon Graham', 'Kevin Huerter', "De'Andre Hunter", 'Damian Jones', 'Skal Labissiere', 'Cam Reddish', 'Jeff Teague', 'Trae Young']
推荐阅读
- sql - 如何创建只有每个月末的日历表 SQL Server 2017
- r - ggplot2中几何对象(geoms)的参数(美学)
- c - opendir 在 C 语言中没有得到缓冲区 char * 的内容?
- php - 需要帮助使用带有数字范围的 SQL 查询值更改 PHP 代码中的表格颜色
- python - 为什么我的 Openstack 身份验证模块不再工作?
- ansible - 无法让 Ansible 剧本在初始运行时运行
- python - 计算机关闭时如何安排任务?
- erp - 在 Infor syteline erp 中生成报告后,我们可以向特定用户发送一次电子邮件吗?
- azure - 使用 Microsoft Azure 将日志分析查询保存到存储帐户
- visual-studio - 通过 LAN 从 Visual Studio for Mac 连接到 .NETCore 3 应用程序