python - Python Mechanize,如何获取 URL 参数
问题描述
我目前正在研究网站抓取工具。因为我必须登录才能访问该网站,所以session ID
必须生成并保存以供进一步使用。
位于 URL的session ID
末尾。
https://example.com/something.php?sid=123456789
我尝试使用该geturl()
命令,但它只返回没有任何参数的 URL。
获取 url 参数的最佳方法是什么?
解决方案
from urllib.parse import urlparse
parsed = urlparse(url)
print(parsed)
输出:
ParseResult(scheme='https', netloc='example.com', path='/something.php', params='', query='sid=123456789', fragment='')
然后,您可以访问:
print(parsed.query)
输出:
sid=123456789
然后,您可以提取:
sid = parsed.query.split('sid=')[-1]
print(sid)
输出:
123456789
推荐阅读
- sql-server - 无法将实体数据模型连接到 SQL Server 数据库文件
- html - 如何在 CSS 中创建这种形状(带圆角的四边形)?
- ios - CollectionView 项目隐藏在顶栏后面
- tinymce - 在 tinymce 编辑器上工作,但无法使用 setcontent 设置值
- java - Hibernate Session#saveOrUpdate - 如果字段是 UTF,如何保存为 UTF?
- reactjs - Firebase 身份验证不适用于 React
- android - 在任何具有硬编码凭据且没有登录弹出窗口的 Android 应用程序上登录到 fb
- c# - 在统一 2019.2.9 中加载资产包时未收到任何数据响应
- javascript - 如何在 vueJS 中重新初始化 v-for 组件
- c# - 如何在过滤的 AdvanceDataGridView 中添加新行