python-3.x - 在加载汤之前如何等待请求?
问题描述
我正在尝试向网站请求请求有效,我可以加载它
但是我试图从网站上获取的内容并没有从那里的服务器中恢复,如下所示:
我将如何解决这个问题?
代码:
import requests
from bs4 import BeautifulSoup
res = requests.get('https://9xbuddy.com/process?url=https://streamango.com/embed/accssmlbkfmmsrcd')
soup = BeautifulSoup(res.text, 'html.parser')
links = [items.get('href') for items in soup.find_all('a', {'class': 'leading-normal sm:leading-none block sm:inline-block bg-blue px-6 sm:px-12 lg:px-6 py-2 text-white no-underline shadow hover:opacity-75'})]
print(links) #[] page sill loading
解决方案
你发出了一个 GET,并解析了它的结果,就好了。但你没有要求你想要的最终文件。你要求一个初始加载器来启动一些 JS webpack 延迟加载。
如果您可以从初始 URL 映射到您关心的最终文档,请为此编写一个函数。否则,如果您需要 javascript 对站点逻辑的解释来查找最终 URL,您可能需要求助于Selenium。
推荐阅读
- c++ - 在向量中查找大于 0(或一般 k)的最小元素的最佳方法是什么?
- php - 由于不活动,该页面已过期。请刷新并重试。“在我登录后在我的生产托管 cpanel 中”laravel 5.5
- php - 在 DataTable 服务器端处理中调用函数
- magento2 - Magento 2.3 Ubuntu 的 Venia 店面设置
- ruby-on-rails - Sidekiq 完成执行作业后,如何更新类实例的状态?
- elasticsearch - elasticsearch 索引映射是 Long 但保存的 String 类型
- c - C中数字的位移
- c# - C#浮点/双差依赖于平台
- rest - nagios 中是否有 API 来检查针对特定 Windows 服务器/(或其服务)添加的最后 schedule_downtime?
- python - 如何根据用户的输入创建列表?带 Python