首页 > 解决方案 > 无法通过 Python 中的 url 下载图像

问题描述

我在网页的源代码中找到了图片的地址。
相关内容如下:

<div class="fwr_page_box">
    <div class="fwr_page" id="PageContainer_0" style="width: 1200px; height: 1696px; margin-left: 815px;">
        <div id="Wrap_0" class="fwr_page_wrap border  fwr_hidden" style="width: 1200px; height: 1696px;"></div>
        <div class="loadingBg" id="loadingBg0" style="width:1200;height:1696;">
            <img alt="" src="http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_00001.jpg" id="ViewContainer_BG_0" class="border  fwr_page_bg_image">
        </div>
    </div>
</div>

然后,我可以使用 chrome 浏览器提取 url ( http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_00001.jpg ),然后手动下载。图大小约为 87 kb。

但是,当我尝试通过wgetpython urllib批量下载这些图像时

end_page = 117
for i in range(0,end_page,1):
    os.system("wget http://162.105.134.188/store/z6MY4xILLZ4Adov3uF7aOQ11/P01_%s.jpg" %"{:05d}".format(i))

这些文件可以下载,而图形大小只有82位,没有任何内容。

标签: pythonpython-3.xwebweb-crawler

解决方案


带有图像的动态 html 由 Javascript 加载,而不是由 wget 或 urllib 加载

用于selenium模拟 Chrome 浏览器,并从中提取内容


推荐阅读