python - 在 Python BeautifulSoup 中查找 div 类的父属性
问题描述
soup = BeautifulSoup(code below, "html.parser")
<item class="info" data="findthisinfo" example="exa1">
<div class="exampleclass">
EXAMPLE INFO
</div>
<item class="info" data="findthisinfo1" example="exa0">
<div class="exampleclass">
EXAMPLE INFO 2
</div>
<item class="info" data="findthisinfo2" example="exa2">
<div class="exampleclass">
SOME TEXT
</div>
for example in soup.find_all('item', attrs={'class': 'info'}):
examp2 = example.find_all('div', attrs={'class': 'exampleclass'})
examp3 = soup('div', text=re.compile("EXAMPLE"))
这给了我以下输出:
[EXAMPLE]
[EXAMPLE]
[]
我现在想找到两个特定输出的父类,例如,我需要 和 的父data="findthisinfo"
值data="findthisinfo1"
我该怎么做呢?
解决方案
您需要做的是收集所有item
标签。
然后遍历它们寻找data
属性
items = soup.findAll('item')
for i in items:
if 'EXAMPLE' in i.text:
print(i.attrs['data'])
印刷
findthisinfo
findthisinfo1
推荐阅读
- mysql - 提高一对多连接的性能
- bash - 如何在 Bash 中将带有空格的数组作为函数参数传递
- sql - 如何限制选择每台设备的最后几天结果
- c - C如何在无符号整数指针之间进行异或
- cakephp - 使用 FormHelper::file 时 SecurityComponent 上的 CSRF 错误
- tomcat - Ctrl-c 不使用 Git Bash 停止 Tomcat
- c# - LINQ查询连接表的多个orderby
- android - 为 CognitoCachingCredentialsProvider 指定用户名/密码
- javascript - 打字稿错误 - 类型“字符串 []”不能用作索引类型
- java - 使用 javax.xml.stream.XMLStreamReader 时如何启用非 IANA 编码