首页 > 解决方案 > 提取谷歌分析javascript背后的内容

问题描述

我正在寻找一种方法来从这样的网站自动访问 .gme 文件的链接-这里没有违法行为,只是儿童玩具的文件。您可以通过单击带有文本“Audiodatei manuell herunterladen”的框中的“Herunterladen”来访问该文件。将弹出一个子窗口,其中包含指向 .gme 文件的直接链接(在本例中为WWW%20Englisch.gme)。

我想自动下载,但我的问题是我无法直接从页面的源代码访问链接。“Herunterladen”链接具有onclick="ga('send', 'event', 'Download_pdp', 'TipToi-Audio-Datei','32904');"我认为是用于使用谷歌分析的 javascript 的属性。有没有办法将其解析为 html 代码以提取链接?文件名非常不一致,因此我无法从网站信息中生成文件名。

提前致谢

标签: javascriptbeautifulsoup

解决方案


该链接有两个事件处理程序,一个通过onclick,一个在代码后面。如果您查看该页面的源代码,并找到那个 onclick 链接,您会看到它有一个 ID。只需搜索该 ID,直到找到与该 ID 相关联的点击处理程序。在事件处理程序中,它显示了弹出的模式的 URL。


推荐阅读