首页 > 解决方案 > Scraping - 查找所有子类的名称

问题描述

我试图找到一种方法来获取子类的数量及其包含在根类中的名称。例如,我想获得类 'o-container__left u-mt-lg' 的回报:

图片

我正在使用 BeautifulSoup。我发现了这个,但它并没有真正达到我的预期:

soup.div["class"]

谢谢您的帮助!

标签: web-scrapingbeautifulsoup

解决方案


from bs4 import BeautifulSoup

data = """
<main class="o-page-content" role="main">
    <section class="o-container">
        <div class="o-container__left u-mt-lg">
            <div class="c-site__container "></div>
            <div class="c-site__container "></div>
            <div class="c-site__container c-site__container__last"></div>
            </div>
        </div>
"""

soup = BeautifulSoup(data, 'html.parser')


for item in soup.findChild('div', attrs={'class': 'o-container__left u-mt-lg'}):
    print(item)

请下次发布HTML作为文本,而不是IMG


推荐阅读