首页 > 解决方案 > 如何在 Python 中使用正则表达式从 HTML 标签中提取 Facebook 页面 URL?

问题描述

标签: pythonhtmlregexweb-scrapingbeautifulsoup

解决方案


def foo(url):
    l = []
    soup = BeautifulSoup(requests.get(url).text, "html.parser")
    links = soup.find_all("a")
    for link in links:
        if not "share" in link.get("href").lower():
            l.append(link)
    return l

此函数检查share链接并返回没有链接的链接share


推荐阅读