python - 使用 bs4 请求抓取
问题描述
我正在尝试抓取此页面,但出现 406 错误。请问我做错了什么?
import requests
from bs4 import BeautifulSoup
url="http://chucknorrisfacts.net/facts"
response = request.get(url)
print(response)
解决方案
添加标题参数:
import requests
from bs4 import BeautifulSoup
url="http://chucknorrisfacts.net/facts"
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36'}
response = requests.get(url,headers=headers)
print(response)
推荐阅读
- python - Exchangelib 扫描所有文件夹 - 效率
- boolean - 使用布尔值难以解决 TRUE FALSE 问题
- oracle - Oracle/PL SQL 等效于 Convert(VARBINARY)
- bash - Cygwin 上的 gdb:bash 中没有输出
- android - AudioStream::getTimestamp 的线程不安全是什么?
- angular - 如何从不同的来源设置我的界面对象的值
- python - 为什么 MySQL 连接器 cursor.execute() 参数应该是变量?
- javascript - Webpack 路径参数不是字符串
- reactjs - 收到 `children` 属性的 NaN
- django - API 转换:从 GraphQL 到 REST(使用 Django)