首页 > 解决方案 > 使用 get_text 处理数组的所有值

问题描述

(免责声明:我是新手,如果这个问题真的很明显,我很抱歉)

你好,

我构建了一个小脚本,以便首先HTML在本地文件中找到标记的某些部分,然后显示不带HTML标签的信息。

我使用bs4find_all/get_text为此。看一看:

from bs4 import BeautifulSoup
with open("/Users/user1/Desktop/testdatapython.html") as fp:
    soup = BeautifulSoup(fp, "lxml")

titleResults = soup.find_all('span', attrs={'class':'caption-subject'})

firstResult = titleResults[0]

firstStripped = firstResult.get_text()

print(firstStripped)

到目前为止,这实际上有效。但我想对 的所有值执行此操作titleResults,而不仅仅是第一个值。但我不能用get_text.

哪种方式最好实现这一目标?titleResults由于本地 html 文件只是一个示例,因此值的数量总是在变化。

先感谢您!

PS我已经查找了这个相关的线程,但遗憾的是它不足以理解或解决问题:

来自 find_all 的 BeautifulSoup get_text

标签: python-3.xbeautifulsoup

解决方案


find_all 返回一个列表

for result in titleResults:
    stripped = result.get_text()
    print(stripped)

推荐阅读