python - python脚本后没有打印,没有错误
问题描述
没有错误只是没有打印结果。它应该从 url 打印出标题。脚本运行,但在解析balancedheadlines
. 我可以将我寻找的标签交换为 p 并返回数据,但我相信我没有正确地通过标签来检索标题。
import requests
from bs4 import BeautifulSoup
url = 'http://www.nytimes.com'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
for ap in soup.find_all('h2', attrs = {"class" : "balancedheader"}):
if ap.a:
print(ap.a.text.replace(".n/", " "))
else:
print(ap.strip)
解决方案
纽约时报网站没有名为“balancedheader”的类的“h2”元素。
xpath '//h2[@class='balancedheader']' 返回一个空集。