首页 > 解决方案 > 如何在 Scrapy 中使用 xpath 来抓取没有类或属性的标签?

问题描述

我正在尝试抓取一个 html 文件,但标签没有任何类或 ID。有没有办法在不使用常规 '//*[class="blah"]/' 格式的情况下为此获取 xpath?

标签: htmlxpathscrapyweb-crawler

解决方案


似乎可以选择仅使用标签,但如果您想查看特定元素,则需要知道特定标签的索引

外壳中的前任

response.xpath('//html/body/table[1]')

如果body标签内有多个带有table标签的元素,那么[1]将指定第一个table标签(xpath从1开始计数)


推荐阅读