首页 > 解决方案 > 使用 request 和 BeautifulSoup 包解码网页

问题描述

我正在尝试python的练习题。问题是“使用 BeautifulSoup 并请求 Python 包打印出纽约时报主页上所有文章标题的列表。” 下面是我的解决方案,但它没有给出任何输出。我正在使用 Jupyter Notebook,当我运行以下代码时,它什么也不做。我的内核也正常工作,这意味着我的代码有问题。

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

base_url= 'https://www.nytimes.com/'
r=requests.get(base_url)
soup=BeautifulSoup(urlopen(base_url))

get_titles=soup.find_all(class_="css-1vctqli esl82me2" )

print()
for title in get_titles:
    print(title.text)

标签: pythonbeautifulsouppython-requests

解决方案


你从哪里得到那个类标签?这不是正确的。

您需要替换css-1vctqli esl82me2css-1j836f9 esl82me3

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

base_url = 'https://www.nytimes.com/'
r = requests.get(base_url)
soup = BeautifulSoup(urlopen(base_url))

get_titles = soup.find_all(class_ = "css-1j836f9 esl82me3")

print()
for title in get_titles:
    print(title.text)

和输出:

在此处输入图像描述


推荐阅读