python - 如何使用 python scrapy 解析 html 字符串
问题描述
我有一个 html 输入元素列表,如下所示。
lists=[<input type="hidden" name="csrf_token" value="jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqCgRLJzc">,
<input type="text" class="form-control" id="username" name="username">,
<input type="password" class="form-control" id="password" name="password">,
<input type="submit" value="Login" class="btn btn-primary">]
从这些我需要提取name、type和value的属性值
例如:考虑输入<input type="hidden" name="csrf_token" value="jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqCgRLJzc">
,然后我需要输出如下字典格式 {'csrf_token':('hidden',"jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqCgRLJzc")}
任何人都可以请指导解决这个问题
解决方案
我建议您使用 Beautiful Soup Python 库 ( https://pypi.org/project/beautifulsoup4/ ) 来获取 HTML 内容和元素的值。已经为此目的创建了一些函数。
推荐阅读
- odoo - 在 Odoo 12 的调试模式下,无法访问 Odoo 表单弹出窗口的视图详细信息?
- python - 如何在球体上生成数据集和概率分布
- android - 将 Room 和 Content Resolver 数据合并到一个对象中
- c++ - C++ 向量 Lower_bound 函数没有像我想的那样工作
- python - Docker + Google Cloud + chromedriver -> 可执行文件需要在 PATH 中
- java - 使用 Java + Linux 在 Cloud Run 上加载 OpenCV 库
- javascript - 我正在尝试创建一个 discord.js 命令,该命令从 json 文件中获取一行,然后将其发送到用户 DM
- java - 如何修复“数据未保存”?
- typescript - 如何用一种具体类型和一种推断类型定义泛型函数
- excel - 如何修复将数据从一个工作簿复制到另一个工作簿的宏