首页 > 解决方案 > 如何在scrapy中按顺序导出标签的文本

问题描述

标签: python-3.xxpathweb-scrapingscrapy

解决方案


尝试以下 XPath 以获取p 排除文本节点的所有后代文本节点a

//p[@class="title"]//text()[not(parent::a)]

PS如果链接看起来像<a href="#">something <b>bold</b> inside</a>你可能需要替换(parent::a)(ancestor::a)


推荐阅读