首页 > 解决方案 > 在scrapy中获取带有内部标签的文本作为字符串

问题描述

我正在使用 css 选择器来提取段落内的文本,例如:'<p>abc<br>xyz<br></p>'

content = txt.css('p::text').get()

返回

abcxyz

但我想要

abc<br>xyz<br>

标签: pythonscrapy

解决方案


get()只返回第一个找到的文本

你需要使用getall()它会返回一个列表然后你需要加入它

" "join(txt.css('p *::text').getall())

推荐阅读