python - Python - 获取网页的 HTML 源代码
问题描述
我想从站点(例如“example.com”)获取 HTML 源代码。
我尝试了以下方法:
import urllib2
response = urllib2.urlopen("https://example.com")
page_source = response.read()
它说:
'没有名为 urllib2 的模块'
我怎样才能防止这个错误?
解决方案
为什么你不使用请求模块?:
import requests
r = requests.get("https://example.com")
print r.text
或者为了正确回答您的问题,您可以使用 pip 和 easy_install 下载 urllib2 模块:
pip install urllib2
easy_isntall urllib2
对于请求:
pip install requests
easy_install requests
对于 requests ,您应该安装 urllib3:
pip install urllib3
easy_install urllib3
推荐阅读
- node.js - 如何安装 node/npm 以便 'sudo npm' 在 ec2 实例上工作?
- python - 尝试从数据框数据创建堆叠条形图
- git - git show 的错误
- apache - Apache HTTP / mod_jk 仅在一名工作人员处于活动状态时工作
- python - 此代码如何将列表格式化为所需的输出?
- java - 看不懂spring框架中@Async注解的文档
- rest - Linkedin API 帖子未显示
- facebook-graph-api - 如何知道页面是否被用户删除?通过 Facebook 图形 API
- ruby-on-rails - 升级 ruby 版本时出错:未定义的方法 `yaml_as'
- kubernetes - Traefik : 不要混淆代码 >400 的 HTTP 正文