python-3.x - 如何使用 xpath 从特定的嵌套类中获取值
问题描述
我试图用 xpath 获取类“sum_num”的值。我有 4 个同名的类
当我运行代码时,我得到值“0”或第三类的值,即跨度文本 - “lblPrice1”
“sum_num”类在页面中存在 4 次,但我只需要该值或第二个。
如何仅从“sum_num”类中获取第二个值?等等 - 这是抓取网页的最佳方式吗?
python(我已经尝试了两个选项):
cost = product_link_selector.xpath('//div[./div/@class="product_code_price"]div/div/div/@class = sum_num/text()').get()
cost = product_link_selector.xpath('//*[contains(@class,"item_sum_group product compare_main")]//*[contains(@class, "sum_num")]').get()
解决方案
您可以使用索引来获取第二项。这是使用索引的示例代码。
(//*[@attribute='attribute_value')[index]
试试下面的。
product_link_selector.xpath('(//*[contains(@class,"item_sum_group product compare_main")]//*[contains(@class, "sum_num")])[2]').get()
推荐阅读
- r - 在R中交换行和列
- docker - 在 prisma deploy 上出现内部服务器错误
- django - Django All_auth/rest_auth 使用 HTTP GET 请求验证电子邮件地址
- google-cloud-firestore - 在集合之间移动文档的云功能
- java - 在特定点显示对象,但仅显示几秒钟
- c# - 有没有办法让多个正在运行的线程从流中提取数据,同时开始将该数据写入单独的文件?
- java - 在自定义反序列化器中将 JsonNode 转换为 POJO
- c# - 在没有登录的情况下输入超链接并在登录后重定向到带有日期时间(小时和分钟)的 ReturnUrl
- c# - 如何在 C# 上通过 winapi 获取默认播放设备 ID?
- python - 尝试使用脚本在 Atom 中导入熊猫时出现 ImportError