python - 有没有办法刮掉没有属性的标签内的文本?
问题描述
html代码看起来像这样
<td> Single cylinder, Liquid-cooled, DOHC, BOSCH EFI </td>
我可以使用这段代码:
soup.find_all('td')
但是,我想要单独的没有属性的标签。那么,如何提取指定它们没有任何属性的标签?
解决方案
通过属性soup.find_all()
手动使用和检查attrs
你可以这样做:
tags = soup.find_all("td")
tags = [i for i in tags if not i.attrs]
然后从新标签列表中获取文本
tags_text = [i.text for i in tags]
attrs
是获取元素所有属性列表的属性
推荐阅读
- mqtt - 寻找本地 Mosquitto 实例和 Watson IoT 平台之间的非安全桥接的工作示例
- mongodb - 使用标准将许多数据从 Mongo 集合传输到另一个集合的最佳方法
- api - 我应该为 Flutter 应用程序使用多个还是单个 API 密钥?
- flutter - 第一次 Flutter gradle 构建失败(出了什么问题:- java/lang/Throwable$WrappedPrintWriter)
- python - 如何将文件从 postgreSQL 保存到本地?
- python - 如何从多元广义帕累托分布生成数据
- sql-server - 在 SQL Server 中查找多对多关系中的重复项
- c# - 当同时构建客户端和服务器代码时,GRPC 代码生成会生成警告
- java - 具有超类功能的子类对象
- java - 带有嵌套 for 循环的 java 代码的复杂性