首页 > 解决方案 > Python Mechanize,如何获取 URL 参数

问题描述

我目前正在研究网站抓取工具。因为我必须登录才能访问该网站,所以session ID必须生成并保存以供进一步使用。

位于 URL的session ID末尾。

https://example.com/something.php?sid=123456789

我尝试使用该geturl()命令,但它只返回没有任何参数的 URL。

获取 url 参数的最佳方法是什么?

标签: pythonurlparametersmechanizemechanize-python

解决方案


from urllib.parse import urlparse

parsed = urlparse(url)
print(parsed)

输出:

ParseResult(scheme='https', netloc='example.com', path='/something.php', params='', query='sid=123456789', fragment='')

然后,您可以访问:

print(parsed.query)

输出:

sid=123456789

然后,您可以提取:

sid = parsed.query.split('sid=')[-1]
print(sid)

输出:

123456789

推荐阅读