python - 无论如何我可以获得img标签的位置吗?在python中使用beautifulsoup查找功能
问题描述
我想知道 .png 图像文件位于 td 标签的哪个位置。
例如,在这种情况下(第 5 行)有什么方法可以获取图像标签的位置?在python中使用beautifulsoup找函数还是scrapy?
</tr>
<tr id="table_1_row_3">
<td style="">A List</td>
<td style=""></td>
<td style="">Itemnumber</td>
<td style="">price</td>
<td style=""></td>
<td style=""><img src='https://www.example.com/.png' /></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style="">min price<BR>a List<BR></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
解决方案
您可以为任务使用内置函数enumerate()
:
from bs4 import BeautifulSoup
txt = '''
<tr id="table_1_row_3">
<td style="">A List</td>
<td style=""></td>
<td style="">Itemnumber</td>
<td style="">price</td>
<td style=""></td>
<td style=""><img src='https://www.example.com/.png' /></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style="">min price<BR>a List<BR></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
<td style=""></td>
</tr>'''
soup = BeautifulSoup(txt, 'html.parser')
# find all positions of <img> inside <tr>:
idx = [i for i, td in enumerate(soup.select('tr > td')) if td.img]
# print indexes, where there is <img> inside <td>:
print(idx)
印刷:
[5]
推荐阅读
- android - Material Component FloatingActionButton 中的 shapeAppearance 导致崩溃
- python - Tensorflow Gradient Tape 返回无
- powershell - 路径中的 Get-Childitem 和括号 [] - 或:LiteralPath + Asterisk
- spring - 本地主机的 Spring Security redirectUri 使用 https 而不是 http
- javascript - axios get 和 post 返回的 data/promise 有区别吗?
- python-3.x - 导入模块时未定义调度程序
- angular - 如何读取 Json 文件并在任何地方作为服务使用?
- android - 在 kotlin 中为 ViewModel 编写单元测试用例
- azure - 正确处理 Azure AD Open ID Connect 的增量同意
- macos - Mac 上的 CLion - 如何引用 /Library/Frameworks?