首页 > 解决方案 > 如何访问在 html 文件中多次存在的部分中的文本?

问题描述

在此处输入图像描述

我该怎么做才能获得预算的价值,只是'6000000'。

tent1 = filmclean.find('h3',{'class':'subheading'}).get_text()

我知道这只会返回“票房”,但如果我这样做:

tent1 = filmclean.find('div',{'class':'txt-block'}).get_text()

它返回“标语:您无法拒绝的提议”。我相信,这是第一次出现类“副标题”的文本。

标签: htmlpandasdataframebeautifulsoup

解决方案


查看图片上的标记,您可以执行以下操作:

print( filmclean.select_one('h3.subheading + div h4').find_next(text=True).strip() )

但是没有 URL 很难 100% 确定。


推荐阅读