python - 使用 Css Selectors 或 xpath 在 scrapy 中提取数据
问题描述
我正在尝试从此链接获取价值:查看源:https ://www.otomoto.pl/ajax/misc/contact/multi_phone/6CLxXv/0/
想要的值是:42 677 17 00 我进入了scrapy shell,然后使用了:response.css('td.line-content::text').extract() 结果我得到了[]。
然后我尝试使用 xpath : response.xpath('/html/body/table/tbody/tr/td[2]/text()').extract() 结果我得到了 [] 。
为什么没有得到想要的结果,这里有什么问题吗?
解决方案
我希望这可以帮助你。
In [159]: response.xpath('//p/descendant-or-self::p[1]/text()').extract()[0].split(':')[1].split('}')[0]
Out[159]: '"42 677 17 00"'
In [160]: print(response.xpath('//p/descendant-or-self::p[1]/text()').extract()[0].split(':')[1].split('}')[0])
"42 677 17 00"
In [161]: print(response.xpath('//p/text()').extract()[0].split(':')[1].split('}')[0])
"42 677 17 00"
推荐阅读
- ios - 如何在Xcode swift中为ui标签使用if语句
- react-native - 安装 Appodeal 后如何修复“程序类型已存在:com.reactlibrary.BuildConfig”
- react-native - 如何在 Ionic React 应用程序中固定 SSL 证书
- flutter - 如何仅使用 PageView 显示下一张卡片的边缘
- grails - Json 文件解析 - Groovy
- sql - SQL 查询从当前日期每周显示日期
- javascript - 因此返回一个 JSX 必然会使函数成为一个组件?
- typescript - NPM 仅安装后依赖项
- javascript - 污染的画布 - 但仅在一台 Windows 10 Chrome PC 上
- python - 我需要一个类似于 pygtrie.PrefixSet 在 python 中的 PrefixMap