python - 无法从“img”标签中提取“src”属性
问题描述
我在电子商务网站上抓取高清图像。这是包含我想要的 url 的 html 块,如开发工具中所示。
<img class="_3togXc _3wp706" alt="" src="https://rukminim1.flixcart.com/image/880/1056/jtn9bww0/t-shirt/5/g/g/m-hm-1001-black-red-helmont-original-imafdfvvr8hqdu65.jpeg?q=50">
但是尝试通过提取 srcresponse.xpath('//img[@class="_3togXc _3wp706"]/@src').extract()
会返回一个空列表。
请帮忙!谢谢。
解决方案
检查响应中的内容。看起来它是在客户端生成的。
此外,您不应该像这样使用 XPath 来选择类,至少contains()
对每个类使用(或更复杂的https://stackoverflow.com/a/1604480/964478),或者更好地使用 CSS 选择器(img._3togXc._3wp706
)。
推荐阅读
- laravel - 如何将望远镜与 moloquent / mongodb 一起使用?
- python - Python:函数内部的 if/else 构造
- android - 如何在 Flutter 中编写自定义平台特定代码
- python - 如何在虚拟环境中执行 Python 测试
- neural-network - 我的神经网络是否达到了局部最小值,因为我的验证损失在达到 90% 的验证准确度后会发生变化?
- python-3.x - 使用 Google Directory API 创建 gmail 组的权限不足
- java - android.view.InflateException: Binary XML file line #11: Error inflating class EditText in android
- tensorflow - How can I modify ModelCheckPoint in keras to monitor both val_acc and val_loss and save accordingly the best model?
- recursion - (M68k) 为什么我的值没有传递到 D0?
- javascript - 点击计算数字