python - 抓取网站时缺少 Python html
问题描述
我试图使用类似的代码来抓取网站
import requests
requests.get("myurl.com").content
但是网站上的一些重要元素丢失了。如何使用 Python 3 获取整个网站内容,就像在 Firefox 或其他浏览器中使用检查器一样?
解决方案
为什么不试试 Scrapy、Selenium 甚至 Splash?它们是强大的抓取库。
推荐阅读
- c# - System.Uri 在 .NET 4.5+ 中丢弃 Unicode RLM(从右到左标记;U+200F)字符
- python - 从具有两列索引的数据框创建线图
- python - 获取 OSError:[WinError 6] 句柄无效
- c# - 在 asp.net core 的数据库中存储图像。我是否应该将图像存储为仅存储上传文件路径的字节就足够了
- github-actions - 有什么方法可以在后续步骤中获取工作流步骤触发器类型以设置条件?[github动作]
- .net - 将 .NET Core MVC 应用程序部署到 IIS,应用程序正在运行,但 wwwroot 中的静态文件未加载
- kotlin - 如何在viewpager2中的FragmentStateAdapter中通知ItemRemove片段
- reactjs - Concat 运行两次,但 if 语句只运行一次,控制台显示只运行一次
- scala - 从 Chill 0.6.0 (Kryo 2.21) 迁移到 0.9.5 (Kryo 4.0.2) 并反序列化旧消息
- javascript - 如何从在 {} 中包含数据的 API 获取数据?