python - 如何在python中使用xpath在h1标签内获取末尾有空格的文本时消除“\ t”?
问题描述
我正在尝试从网页中获取此文本“Aggreko (AGGK)”(检查图像)。当使用 xpath 来获取它时,我得到了下面提到的输出。
代码:
companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()')
输出:
['3I Group PLC (III)\t']
假设它是因为最后的空白,试图重写代码如下。然而得到了相同的输出。
代码 :
companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()[normalize-space()]')
我如何消除这个 \t ?
解决方案
使用 Pythonstrip()
方法。
companyName = root.xpath('//*[@id="leftColumn"]/div[1]/h1/text()').strip()
推荐阅读
- macos - AppleScript 消息格式 - 新换行符完全失败
- swift - 为什么我得到:“无法转换 '[String] 类型的值?' 到预期的参数类型“字符串?”
- jmeter - 从 jmeter 启动 aws cli 命令
- deep-learning - 来自 CNN 和 R-CNN 的区域特征
- javascript - 点击更改链接背景颜色
- python - Python Pandas 总数和日期
- ios - 如何锁定项目的 CocoaPods 版本?
- neo4j - 基于加权距离从源节点探索图
- android - react-native logcat 为什么一直显示:D/EGL_adreno: eglMakeCurrent?
- bash - Unix bash将带空格的字符串分配给变量