首页 > 解决方案 > 使用 BeautifulSoup 和请求解码网页

问题描述

我第一次尝试这个,所以要温柔...... :-)

按照此:

https://stackoverflow.com/questions/54117047/decode-a-web-page-using-request-and-beautifulsoup-package

我使用公认的答案作为我的基础。

我的代码:

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

base_url = 'https://www.nytimes.com/'
r = requests.get(base_url)
soup = BeautifulSoup(urlopen(base_url), features="lxml")

get_titles = soup.find_all(class_="css-6n7j50")

print()
for title in get_titles:
    print(title.text)

我可以在调试器中看到汤中的两个项目: 在此处输入图像描述

但没有打印。

我要做的就是从 base_url 中提取标题,格式化并打印它们。

标签: python-3.xbeautifulsouppython-requests

解决方案


它打印空字符串的原因是当你运行时

for title in get_titles:
    print(title.text)

标题的对象中没有文本。text 属性返回标签的内部 HTML 和 title 对象中只有标签的属性的值。


推荐阅读