python - 是否有使用 Python 和请求对网站进行身份验证的通用说明?
问题描述
我正在为中学生写一个关于如何使用 Python 和 requests/lxml 来抓取网站数据的简单指南。未经身份验证的抓取是微不足道的,但我想挑战一些学生对他们必须登录的网站进行抓取。我在使用 csrf 令牌之前已经这样做了......
auth = {
'user_login_form[_username]' : 'user@email.com',
'user_login_form[_plainPassword]' : 'secret_password',
'user_login_form[csrf_token]' : 'token'
}
login_url = 'https://website.com/login_check'
session = requests.Session()
a = session.post(
login_url,
data=auth
)
print('Connecting to site ...',a.ok)
...但
- 我不记得我在哪里找到了令牌
- 我认为这非常特定于我正在访问的网站。
那么,是否有适用于大多数/所有网站的通用 Python/请求的模式/指令集?
解决方案
推荐阅读
- rest - 目录的 REST API 中的层次结构
- javascript - 谷歌图表 clearChart() 与 vue-google-charts
- typescript - 没有“新”就无法调用类构造函数构造 - aws cdk
- c# - 如何使用 ClosedXML 读取 Excel 下拉列表值
- javascript - 这算作 GA 中的两次综合浏览量,我需要第二次综合浏览量吗?
- c++ - 在 getBuildTasks() 中找不到客户端 URI - VSCode - C++
- javascript - 可见性断言差异
- list - 在涉及算术运算和计数元素的列表上递归?
- ios - 如何使用 swift 从 ios Healthkit 应用程序获取低心率通知?
- c++ - C++ //动态内存分配