首页 > 解决方案 > 解析后无法正确解析html/空正文

问题描述

我面临一个奇怪的问题。我试图解析以下 html:

在此处输入图像描述

问题是当我这样做时

response.xpath('//div//section//div[@id="hiring-candidate-app"]')[0].extract()

我只得到

'<div id="hiring-candidate-app"></div>'

而不是hiring-candidate-app.

例如,我想得到 ,inside-content但看起来我什至没有在响应中得到它。这个网页需要登录,我就是。

提前致谢!

标签: xpathscrapycss-selectorsselector

解决方案


看起来您的 Xpath 正在抓住正确的东西。但是您的问题可能与呼叫的“[0]”部分有关。我会删除它以获取 div 的全部内容。


推荐阅读