首页 > 解决方案 > 使用 Python Selenium 查找表的无限嵌套元素

问题描述

报价链

你好,

站点 url 是:这是我正在从该站点抓取回复的 URL
,并且我被引号中的这些引号所困扰。

REPLY = "//div[@class='icerik']"
answers = wait.until(EC.presence_of_element_located((By.XPATH, REPLY)))
answers = browser.find_elements_by_xpath(REPLY)
for answer in answers:

    cell = answer.find_elements_by_class_name("msg")
    if len(cell) != 0:
        for c in cell:
            c.find_element_by_tag_name("td")
            print("..........Mesajın basi...............\n")
            print(c.text)
            print("\n")
            print("..........Mesajın sonu...............\n")
            print("######################################\n")
        else:
            continue

我可以取消任何报价和回复,但我希望它们分开。在这种情况下,报价链可以是无限的。我已经为 REPLY 尝试了各种 xpath,但我找不到解决方案。使用 REPLY xpath 废弃引号和回复本身。

很快,我想用不同的字符串一一废弃回复本身和这些引号。

感谢您的回答。这是此报价链的 HTML 代码。 引用 HTML

标签: pythonhtmlseleniumscreen-scraping

解决方案


推荐阅读