python-3.x - 使用 BeautifulSoup 和请求解码网页
问题描述
我第一次尝试这个,所以要温柔...... :-)
按照此:
https://stackoverflow.com/questions/54117047/decode-a-web-page-using-request-and-beautifulsoup-package
我使用公认的答案作为我的基础。
我的代码:
import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen
base_url = 'https://www.nytimes.com/'
r = requests.get(base_url)
soup = BeautifulSoup(urlopen(base_url), features="lxml")
get_titles = soup.find_all(class_="css-6n7j50")
print()
for title in get_titles:
print(title.text)
但没有打印。
我要做的就是从 base_url 中提取标题,格式化并打印它们。
解决方案
它打印空字符串的原因是当你运行时
for title in get_titles:
print(title.text)
标题的对象中没有文本。text 属性返回标签的内部 HTML 和 title 对象中只有标签的属性的值。
推荐阅读
- python - 从复杂的 json 内容中获取值
- mysql - 在不使用交叉连接(MySQL 5.6)的情况下,如何在提供的示例数据中为两个字段的所有不同条目实现笛卡尔积?
- python - 带有用户令牌的 guild.members 不起作用
- python-3.x - 在 docker 内使用 g++ 编译 pybind11 失败
- python - Thread won't stop until window is destroyed, window won't destroy unless thread is stopped
- docker - Fluentbit kubernetes - 如何在 /var/log/ 中存在的应用程序日志中添加 kubernetes 元数据
/ 小路 - python - python tkinter如何使用画布找到特定列表中最近的项目
- java - 未找到 Maven 模块:javafx.fxml
- laravel - 如何使用查询字符串重定向命名路由?
- php - 使用 php 将商品添加到购物车