python - 使用 beautifulSoup 检索 html 标签内容
问题描述
我正在尝试使用 python 获取网站文章的纯文本。我听说过 BeautifulSoup 库,但是如何检索 html 页面中的特定标签?
这就是我所做的:
base_url = 'http://www.nytimes.com'
r = requests.get(base_url)
soup = BeautifulSoup(r.text, "html.parser")
解决方案
看看这个:
import bs4 as bs
import requests as rq
html = rq.get('site.com')
s = bs.BeautifulSoup(html.text, features="html.parser")
div = s.find('div', {'class': 'yourclass'}) # or id
print(str(div.text)) # print text
推荐阅读
- c# - 如何在 C#/WPF 中检测 Grid 中的溢出
- python - 为什么 CNN 模型即使在 TensorFlow 中使用 delete 命令,仍然会超过 GPU 内存?
- c# - MVVM Execute 方法每 x 秒/分钟,窗口倒计时
- php - 如何使用碳在laravel中将时间格式化为“H:i:s”
- matlab - 选择前 250 个数据
- javascript - 如何调整临时图像文件的大小以提高性能?
- java - getContentLength() 返回与浏览器中不同的值
- python - 有条件地计算员工与经理的关系
- c# - 我可以为 .NET Core DependencyInjection 提供一个“解析器”以返回任何未注册服务的最小起订量吗?
- javascript - 如何解决“反应问题(重启机器人)”