首页 > 解决方案 > 理解谷歌的 HTML

问题描述

第一次在这里海报。

我只是进入 python 和一般编码,我正在研究请求和 BeutifulSoup 库。我正在尝试从谷歌图片中获取图片网址。在 chrome 中检查网站时,我可以找到“div”和正确的 img src url。但是当我打开“请求”给我的 HTML 时,我可以找到相同的“div”,但 img src url 是完全不同的,如果使用只会导致黑页。

HTML 请求的 Img 得到

在 chrome 的检查工具中找到的 HTML 的 Img

我想知道并想了解的是:

  1. 为什么这些 HTML 不同
  2. 如何获取带有请求的检查工具找到的 img src?

希望这个问题有意义,并提前感谢您的帮助!

标签: pythonhtml

解决方案


  1. 也许响应 HTML 和 chrome 检查器中的代码之间的差异源于 JS 更改页面时对页面的更新。例如,当您使用 innerHTML() 编辑 div 元素时,您添加的代码将添加到 DOM 堆栈中,因此检查器中的代码将不会影响响应。

  2. 您可以http://在最后搜索乞求和.png.jpg或任何其他图像格式。


推荐阅读