python - 使用 Python & BeautifulSoup 抓取 HTML 标签标识符值
问题描述
我还在学习 Python,一直在用 BeautifulSoup 抓取一些网络数据,我的问题是:是否可以抓取标签 ID 值?
也许最好举个例子,我正在使用的 HTML 代码如下所示:
<A CLASS="someClass" uniqueID="someValue" anotherID="someOtherValue">
Here is the data I can scrape right now.
</A>
因此,从上面的示例中,我可以成功地抓取 A 标签之间的内容,但我不知道如何抓取存在于 A 标签内的“uniqueID”和“anotherID”的值。
感谢您的任何指点!
解决方案
请查看我发布的评论中的链接,但我认为您正在尝试做的是这样的事情;
soup.find("a", {"uniqueID": "someValue"})
如果您要发布代码示例,我可以对其进行定制,但因为您没有,所以它相当通用。
推荐阅读
- mephisto - 运行 parlai_chat_task_demo python3 parlai_test_script.py 时出现意外错误
- go - 我可以将地图值解压缩为函数参数吗?
- c++ - 为什么 * 不适用于列表中的第二个变量?
- android - Android 上的 Azure AD B2C:他的应用程序仍在使用旧版 MSAL 重定向 uri 并切换到 MSAL 本地身份验证
- android - 面对“每个孩子必须恰好布置一次。相关的导致错误的小部件是:脚手架”颤动中的错误
- reactjs - Nginx 发出 413 请求实体太大
- python - 如何摆脱 pytest 控制台输出中测试的完整路径?
- c++ - 如何将 cpp dll 加载到 kotlin 本机
- vue.js - 使用 Vuetify 创建动态游戏板?
- android - 如果选择了另一个项目,我如何取消选择一个项目?