python - 如何获取具有相同类名和属性的特定项目
问题描述
如何获得具有相同类名和属性的特定项目?
我需要得到这 3 件物品
2013 年 4 月 14 日
580
佛罗里达州皮尔斯堡
<dl class="pairsJustified">
<dt>Joined:</dt>
<dd>Apr 14, 2013</dd>
</dl>
<dl class="pairsJustified">
<dt>Messages:</dt>
<dd><a href="search/member?user_id=13302" class="concealed"
rel="nofollow">580</a></dd>
</dl>
<dl class="pairsJustified">
<dt>Location:</dt>
<dd>
<a href="misc/location-info?location=Fort+Pierce%2C+FL" target="_blank"
rel="nofollow noreferrer" itemprop="address" class="concealed">Fort
Pierce, FL</a>
解决方案
使用它们位于<dd>
标签下,使用.find_all()
:
from bs4 import BeautifulSoup
test = '''<dl class="pairsJustified">
<dt>Joined:</dt>
<dd>Apr 14, 2013</dd>
</dl>
<dl class="pairsJustified">
<dt>Messages:</dt>
<dd><a href="search/member?user_id=13302" class="concealed"
rel="nofollow">580</a></dd>
</dl>
<dl class="pairsJustified">
<dt>Location:</dt>
<dd>
<a href="misc/location-info?location=Fort+Pierce%2C+FL" target="_blank"
rel="nofollow noreferrer" itemprop="address" class="concealed">Fort Pierce, FL</a>'''
soup = BeautifulSoup(test, 'html.parser')
data = soup.find_all("dd")
for d in data:
print(d.text.strip())
输出:
Apr 14, 2013
580
Fort Pierce, FL
推荐阅读
- powershell - 使用 powershell 打开多个 rdp 会话
- visual-studio-code - 如何在 VS Code 版本 1.29.1 中将终端窗口停靠在右侧?
- sql - 将 db2 转换为 SQL Server
- ios - 我们可以暂时从 Apple App Store 中隐藏 iOS 应用程序吗?
- groovy - 根据另一组随机数据随机化数据以在 Jmeter 中作为请求正文发送
- android - 无法使用 setCornerRadius 方法圆圆可绘制的角
- c# - 当我使用 XPath 提取数据时,它在 messagebox.show 中没有给出任何响应
- soap - JBOSS 服务器上的 SOAP 示例
- arrays - Swift - dictionary with array - get reference to array
- javascript - 提取存储在字符串中的数据