首页 > 解决方案 > 使用 Python & BeautifulSoup 抓取 HTML 标签标识符值

问题描述

我还在学习 Python,一直在用 BeautifulSoup 抓取一些网络数据,我的问题是:是否可以抓取标签 ID 值?

也许最好举个例子,我正在使用的 HTML 代码如下所示:

<A CLASS="someClass" uniqueID="someValue" anotherID="someOtherValue">
Here is the data I can scrape right now.
</A>

因此,从上面的示例中,我可以成功地抓取 A 标签之间的内容,但我不知道如何抓取存在于 A 标签内的“uniqueID”和“anotherID”的值。

感谢您的任何指点!

标签: pythonweb-scrapingbeautifulsoup

解决方案


请查看我发布的评论中的链接,但我认为您正在尝试做的是这样的事情;

soup.find("a", {"uniqueID": "someValue"})

如果您要发布代码示例,我可以对其进行定制,但因为您没有,所以它相当通用。


推荐阅读