首页 > 解决方案 > 有没有办法刮掉没有属性的标签内的文本?

问题描述

html代码看起来像这样

<td> Single cylinder, Liquid-cooled, DOHC, BOSCH EFI </td> 

我可以使用这段代码:

soup.find_all('td')

但是,我想要单独的没有属性的标签。那么,如何提取指定它们没有任何属性的标签?

标签: pythonweb-scrapingbeautifulsoup

解决方案


通过属性soup.find_all()手动使用和检查attrs

你可以这样做:

tags = soup.find_all("td")

tags = [i for i in tags if not i.attrs]

然后从新标签列表中获取文本

tags_text = [i.text for i in tags]

attrs是获取元素所有属性列表的属性


推荐阅读