python - 无法通过 Python 中的 url 下载图像
问题描述
我在网页的源代码中找到了图片的地址。
相关内容如下:
<div class="fwr_page_box">
<div class="fwr_page" id="PageContainer_0" style="width: 1200px; height: 1696px; margin-left: 815px;">
<div id="Wrap_0" class="fwr_page_wrap border fwr_hidden" style="width: 1200px; height: 1696px;"></div>
<div class="loadingBg" id="loadingBg0" style="width:1200;height:1696;">
<img alt="" src="http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_00001.jpg" id="ViewContainer_BG_0" class="border fwr_page_bg_image">
</div>
</div>
</div>
然后,我可以使用 chrome 浏览器提取 url ( http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_00001.jpg ),然后手动下载。图大小约为 87 kb。
但是,当我尝试通过wget或python urllib批量下载这些图像时
end_page = 117
for i in range(0,end_page,1):
os.system("wget http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_%s.jpg" %"{:05d}".format(i))
这些文件可以下载,而图形大小只有82位,没有任何内容。
解决方案
带有图像的动态 html 由 Javascript 加载,而不是由 wget 或 urllib 加载
用于selenium
模拟 Chrome 浏览器,并从中提取内容
推荐阅读
- python - 在一列上安装 one-hot 编码器并适用于许多
- c# - 可视代码中的 asp.net core razor pages 项目 localhost:5001 返回此站点无法访问
- javascript - 修改firebase规则
- python - 安装 deeptools 时如何解决 UnsatisfiableError?
- octave - 如何修复 Octave 代码中的索引错误?
- google-apps-script - 如何通过工作表 openByID 中的索引行和列获取范围?
- transfer-learning - 什么是 fn.split('\\')[1].split('.')[0].strip()?
- bash - sort 的输出似乎没有排序
- selenium - 如何在 conftest 中初始化 selenium webdriver?
- html - 子组件 HTML 在 DOM 中时未呈现