首页 > 解决方案 > 如何使用 python 在 html 代码中定位 td 类?

问题描述

我的 html 代码中有一个类。我需要使用 python 定位 td 类“Currentlocation”。

代码 :

<td class="CURRENTLOCATION"><img align="MIDDLE" src="..\Images\FolderOpen.bmp"/> Metrics</td>

以下是我尝试过的代码。

第一次尝试:

My_result = page_soup.find_element_by_class_name('CURRENTLOCATION')

出现“TypeError:'NoneType' 对象不可调用”错误。第二次尝试:

My_result = page_soup.find(‘td’, attrs={‘class’: ‘CURRENTLOCATION’})

出现“标识符中的无效字符”错误。

谁能帮我使用python在html代码中找到一个类?

标签: pythonhtmlpython-3.xweb-scrapingdata-extraction

解决方案


BeautifulSoup 中有一个功能。您可以获得所有所需的标签并指定您在 find_all 函数中查找的属性。它返回满足条件的所有元素的列表

import re
from bs4 import BeautifulSoup 
text = '<td class="CURRENTLOCATION"><img align="MIDDLE" src="..\Images\FolderOpen.bmp"/> Metrics</td>'
soup = BeautifulSoup(text, 'lxml')
output_list = soup.find_all('td',{"class": "CURRENTLOCATION"}) # I am looking for all the td tags whose class atrribute is set to CURRENTLOCATION 

推荐阅读