java - Java JSoup 从网站抓取 img src 返回一个奇怪的 url
问题描述
对于一个 img 我得到这个作为回报:
/wcsstore/SafeStorefrontAssetStore/locale/en_GB/Style1/img/email/spacer.gif
我尝试使用 .attr("abs:src") 和 .attr("src") 但都返回错误的网址。
Elements prods = doc.select(".product");
Elements img = prods.get(i).select(".productHeader a img");
String imageUrl = img.attr("src");
解决方案
我认为你的问题是你的选择器:
元素 img = prods.get(i).select(" .productHeader >a>img ");
那应该可以解决您的问题!
新条目:您需要检查“data-src”,它具有前面没有协议的图像的 url String imageUrl = img.attr("data-src");
=> 例如“//img.game.co.uk/ml2/7/3/1/5/731542_ps4_b.png”
推荐阅读
- laravel - 有没有办法使用 JWT 和 Laravel 修复传递给 Tymon\\JWTAuth\\JWTGuard::__construct() 的参数 2?
- tableau-api - Tableau 维度分组和使用两个日期字段?
- r - 您如何在 Rstudio 上从同一网站上抓取多个页面
- python - Python Camelot - 如何从表中删除线喙/n
- angular - 在指令中使用哪个@HostListener 来监听表单控件重置/设置值?
- sql - 如何在特定时间间隔内填充缺失值
- python - 将临时文件传递给 Popen 子进程?
- spring-boot - 尝试将 JSR330ScopeMetadataResolver 与 Spring Boot 一起使用但没有成功
- apache-spark - 在 SparkSQL 中进行 GroupBy 后获取所有行
- laravel - 如何验证以使时间在当前时间之后