首页 > 解决方案 > python脚本后没有打印,没有错误

问题描述

没有错误只是没有打印结果。它应该从 url 打印出标题。脚本运行,但在解析balancedheadlines. 我可以将我寻找的标签交换为 p 并返回数据,但我相信我没有正确地通过标签来检索标题。

import requests
from bs4 import BeautifulSoup

url = 'http://www.nytimes.com'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')


for ap in soup.find_all('h2', attrs = {"class" : "balancedheader"}):

    if ap.a:
        print(ap.a.text.replace(".n/", " "))
    else:
        print(ap.strip)

标签: pythonhtmlbeautifulsoup

解决方案


纽约时报网站没有名为“balancedheader”的类的“h2”元素。

xpath '//h2[@class='balancedheader']' 返回一个空集。


推荐阅读