首页 > 解决方案 > 如何在python中使用xpath在h1标签内获取末尾有空格的文本时消除“\ t”?

问题描述

我正在尝试从网页中获取此文本“Aggreko (AGGK)”(检查图像)。当使用 xpath 来获取它时,我得到了下面提到的输出。

代码:

companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()')

输出:

['3I Group PLC (III)\t']

假设它是因为最后的空白,试图重写代码如下。然而得到了相同的输出。

代码 :

companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()[normalize-space()]')

在此处输入图像描述

我如何消除这个 \t ?

标签: pythonhtmlxpathweb-scraping

解决方案


使用 Pythonstrip()方法。

companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()').strip()

推荐阅读