python - 将 cookie 加载到 Python 请求会话时出错
问题描述
我正在尝试将 cookie 从 selenium 导出的 cookie 加载到 Python 中的请求会话中,但是当我这样做时,它会返回以下错误:“'list' object has no attribute 'extract_cookies'”
def load_cookies(filename):
with open(filename, 'rb') as f:
return pickle.load(f)
initial_state= requests.Session()
initial_state.cookies=load_cookies(time_cookie_file)
search_requests = initial_state.get(search_url)
我在任何地方都看到这应该可以工作,但是我的 cookie 是一个字典列表,这是我理解所有 cookie 的内容,以及为什么我认为这适用于 Selenium。但是由于某种原因,它不适用于请求,这方面的任何和所有帮助都会非常棒,感觉就像我错过了一些明显的东西!
Cookie 已使用以下方法从 Selenium 中转储:
with open("Filepath.pkl", 'wb') as f:
pickle.dump(driver.get_cookies(), f)
cookie 的一个例子是(稍微混淆):
[{'domain': '.website.com',
'expiry': 1640787949,
'httpOnly': False,
'name': '_ga',
'path': '/',
'secure': False,
'value': 'GA1.2.1111111111.1111111111'},
{'domain': 'website.com',
'expiry': 1585488346,
'httpOnly': False,
'name': '__pnahc',
'path': '/',
'secure': False,
'value': '0'}]
我现在已经设法按照下面的答案加载了 cookie,但是似乎没有正确加载 cookie,因为它们不记得任何内容,但是如果我在通过 Selenium 浏览时加载 cookie,它们可以正常工作。
解决方案
曲奇饼
Cookie
HTTP 请求标头包含存储HTTP cookie
先前由服务器发送的标Set-Cookie
头。HTTP cookie是服务器发送到用户 Web 浏览器的一小段数据。浏览器可能会存储cookie并将其与下一个请求一起发送回同一服务器。通常,cookie可以判断两个请求是否来自同一个浏览器,从而使用户保持登录状态。
使用 Selenium 进行演示
为了演示使用Selenium使用 cookie,我们在用户登录网站http://demo.guru99.com/test/cookie/selenium_aut.php后使用pickle存储了 cookie 。在下一步中,我们打开了同一个网站,添加了 cookie,并且能够以登录用户的身份登陆。
用于存储 cookie 的代码块:
from selenium import webdriver import pickle options = webdriver.ChromeOptions() options.add_argument("start-maximized") options.add_experimental_option("excludeSwitches", ["enable-automation"]) options.add_experimental_option('useAutomationExtension', False) driver = webdriver.Chrome(options=options, executable_path=r'C:\Utility\BrowserDrivers\chromedriver.exe') driver.get('http://demo.guru99.com/test/cookie/selenium_aut.php') driver.find_element_by_name("username").send_keys("abc123") driver.find_element_by_name("password").send_keys("123xyz") driver.find_element_by_name("submit").click() pickle.dump( driver.get_cookies() , open("cookies.pkl","wb"))
使用存储的 cookie 进行自动身份验证的代码块:
from selenium import webdriver import pickle options = webdriver.ChromeOptions() options.add_argument("start-maximized") options.add_experimental_option("excludeSwitches", ["enable-automation"]) options.add_experimental_option('useAutomationExtension', False) driver = webdriver.Chrome(options=options, executable_path=r'C:\Utility\BrowserDrivers\chromedriver.exe') driver.get('http://demo.guru99.com/test/cookie/selenium_aut.php') cookies = pickle.load(open("cookies.pkl", "rb")) for cookie in cookies: driver.add_cookie(cookie) driver.get('http://demo.guru99.com/test/cookie/selenium_cookie.php')
使用请求的演示
为了通过会话和请求演示 cookie 的使用,我们访问了站点https://www.google.com,添加了一个新的 cookie 字典:
{'name':'my_own_cookie','value': 'debanjan' ,'domain':'.stackoverflow.com'}
接下来,我们使用相同的请求会话发送另一个成功的请求,如下所示:
代码块:
import requests s1 = requests.session() s1.get('https://www.google.com') print("Original Cookies") print(s1.cookies) print("==========") cookie = {'name':'my_own_cookie','value': 'debanjan' ,'domain':'.stackoverflow.com'} s1.cookies.update(cookie) print("After new Cookie added") print(s1.cookies)
控制台输出:
Original Cookies <RequestsCookieJar[<Cookie 1P_JAR=2020-01-21-14 for .google.com/>, <Cookie NID=196=NvZMMRzKeV6VI1xEqjgbzJ4r_3WCeWWjitKhllxwXUwQcXZHIMRNz_BPo6ujQduYCJMOJgChTQmXSs6yKX7lxcfusbrBMVBN_qLxLIEah5iSBlkdBxotbwfaFHMd-z5E540x02-YZtCm-rAIx-MRCJeFGK2E_EKdZaxTw-StRYg for .google.com/>]> ========== After new Cookie added <RequestsCookieJar[<Cookie domain=.stackoverflow.com for />, <Cookie name=my_own_cookie for />, <Cookie value=debanjan for />, <Cookie 1P_JAR=2020-01-21-14 for .google.com/>, <Cookie NID=196=NvZMMRzKeV6VI1xEqjgbzJ4r_3WCeWWjitKhllxwXUwQcXZHIMRNz_BPo6ujQduYCJMOJgChTQmXSs6yKX7lxcfusbrBMVBN_qLxLIEah5iSBlkdBxotbwfaFHMd-z5E540x02-YZtCm-rAIx-MRCJeFGK2E_EKdZaxTw-StRYg for .google.com/>]>
结论
显然,新添加的 cookie 字典{'name':'my_own_cookie','value': 'debanjan' ,'domain':'.stackoverflow.com'}
几乎在第二个请求中使用。
将 Selenium Cookie 传递给 Python 请求
现在,如果您的用例是将 Selenium Cookie 传递给 Python 请求,您可以使用以下解决方案:
from selenium import webdriver
import pickle
import requests
options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)
driver = webdriver.Chrome(options=options, executable_path=r'C:\Utility\BrowserDrivers\chromedriver.exe')
driver.get('http://demo.guru99.com/test/cookie/selenium_aut.php')
driver.find_element_by_name("username").send_keys("abc123")
driver.find_element_by_name("password").send_keys("123xyz")
driver.find_element_by_name("submit").click()
# Storing cookies through Selenium
pickle.dump( driver.get_cookies() , open("cookies.pkl","wb"))
driver.quit()
# Passing cookies to Session
session = requests.session() # or an existing session
with open('cookies.pkl', 'rb') as f:
session.cookies.update(pickle.load(f))
search_requests = session.get('https://www.google.com/')
print(session.cookies)
推荐阅读
- java - 为什么kafka中有多个反序列化器,如字符串、字节、短?
- ruby-on-rails - 如何将 split 与存储在变量中的正则表达式一起使用?
- html - 将 Font-awesome 插入符号向上和插入符号向下堆叠相邻
- reactjs - 使用 react native firebase 消息传递和 react native firebase 时出错?
- powerbi - 每个 Hiarchy 级别度量计算并将计算聚合到更高级别
- javascript - 点击搜索输入的酷炫css效果
- lua - 如何在 Lua 中执行基本身份验证
- spring-boot - 如何在弹性搜索中使用纬度经度搜索位置附近的区域
- c++ - 从共享库中剥离符号似乎不起作用
- mysql - 致命错误:试图读取结果集