python-3.x - 请求模块未收到源代码
问题描述
我正在使用请求模块向服务器发送请求。作为回应,我从页面源中得到的只是几行而不是整个页面。
from urllib.error import HTTPError
from urllib.error import URLError
from bs4 import BeautifulSoup
import requests
url = "https://www.yellowpages.ae/c/advs/uae/web.html"
header = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'en-GB,en;q=0.9,en-US;q=0.8,ml;q=0.7',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'Host': 'www.yellowpages.com',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
try:
print("Present Link: ", url)
response = requests.get(url, headers=header)
except HTTPError as e:
print(e)
except URLError:
print("URL Error")
else:
print(response.status_code)
print("response is:", response.text)
如果我没有在请求中发送标头, 则页面输出只是这个数据,而页面源包含很多文本,请检查它并建议我做错了什么。
Web at Yellowpages.ae
window.onload = markiconsLarge;
}
$create(Sys.Extended.UI.AutoCompleteBehavior, {"completionSetCount":12,"delimiterCharacters":"","id":"advs_autokey","minimumPrefixLength":2,"serviceMethod":"Getkeyword","servicePath":"../../../YpWebService.asmx","useContextKey":true}, null, null, $get("advs_txtkey"));
});
. . . . .
类似的东西无法将整个输出粘贴为代码。因此,这只是阐明我的观点的一部分。
将不胜感激。谢谢
解决方案
推荐阅读
- wordpress - 尝试将使用 Nginx 和 Bitnami 托管的我的 Wordpress 网站移动到不同的 url 路径,但 CSS 和 JS 文件变得不可用
- taskwarrior - 如何使用taskwarrior设置或修改明天到期的任务?
- django - 如何根据外键过滤表单?
- assembly - GNU gas 中的零是多少?
- delphi - 帕斯卡中的塞德尔方法
- javascript - VueJS:过滤功能仅适用于重新加载
- regex - 将西里尔字符与 kotlins Regex.kt 匹配
- css - CSS 动画在开发过程中有效,但在网站被推送时停止,为什么?
- flutter - 在颤动中使用流进行分页
- ruby-on-rails - 升级到 ruby 3 和 rails 6.1 后未定义的方法“file_fixture_path”