python - requests.get 不返回任何内容
问题描述
我正在尝试使用 requests.get 检索 url
import requests
from bs4 import BeautifulSoup
baseurl = "https://www.olx.com.eg/"
headers = {
'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
}
r = requests.get('https://www.olx.com.eg/jobs/')
soup = BeautifulSoup(r.content, 'lxml')
product_list = soup.findAll('div',class_ = 'ads__item')
print(product_list)
但它返回一个空列表,因为它甚至不打开 URL。
这里有什么问题?
解决方案
将headers=
参数添加到requests.get
:
import requests
from bs4 import BeautifulSoup
baseurl = "https://www.olx.com.eg/"
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36"
}
r = requests.get("https://www.olx.com.eg/jobs/", headers=headers)
soup = BeautifulSoup(r.content, "lxml")
product_list = soup.findAll("div", class_="ads__item")
print(len(product_list))
印刷:
45
推荐阅读
- c++ - 包括用于实现多态性的多个标头
- nginx - 如何在 TCP 代理后面配置 kafka 代理
- java - 如何使用 Morphia 执行从 MongoDb 中的嵌套数组中删除元素的查询?
- javascript - D3图形上的显示区域
- python - Windows“jupyter notebook”命令失败
- php - 如何在 php soap 中调用 sap soap wsdl?
- c - 在一个序列点,之前对 volatile 对象的所有访问都已稳定
- python - 如何使用注意力机制在多层双向中操纵编码器状态
- python - 使用带有 signal.pause() 函数的 try-except 语句
- windows-10 - jacob 和 Word ComObject 的 Windows 10 >= 1809 问题