首页 > 解决方案 > 是否有使用 Python 和请求对网站进行身份验证的通用说明?

问题描述

我正在为中学生写一个关于如何使用 Python 和 requests/lxml 来抓取网站数据的简单指南。未经身份验证的抓取是微不足道的,但我想挑战一些学生对他们必须登录的网站进行抓取。我在使用 csrf 令牌之前已经这样做了......

auth = {
  'user_login_form[_username]'      : 'user@email.com',
  'user_login_form[_plainPassword]' : 'secret_password',
  'user_login_form[csrf_token]'     : 'token'
  }
login_url = 'https://website.com/login_check'
session = requests.Session()
a = session.post(
  login_url,
  data=auth
  )
print('Connecting to site ...',a.ok)

...但

  1. 我不记得我在哪里找到了令牌
  2. 我认为这非常特定于我正在访问的网站。

那么,是否有适用于大多数/所有网站的通用 Python/请求的模式/指令集?

标签: pythonpython-requests

解决方案


推荐阅读