首页 > 解决方案 > 如何提取 30 秒后加载的重定向链接?

问题描述

当我点击网站的下载按钮时。它告诉等待 30 加载并重定向到谷歌驱动器。我想直接获取链接(重定向链接)


https://www.engineerrefe.com/2019/05/protection-of-industrial-power.html

这是有下载按钮的网站。

下载按钮的链接位置。

https://www.engineerrefe.com/p/redirect.html??&&url= https://drive.google.com/file/d/1wIhS0QPuyEOWZrSnP0wtKHTWGCpbely

我尝试 (.url ) 模块通过复制下载链接来获取重定向链接。

import requests
#Link Location of Download button
page_contents = requests.get('https://www.engineerrefe.com/p/redirect.html??&&url=_https://drive.google.com/file/d/1wIhS0QPuyEOWZrSnP0wtKHTWGCpbely_')
print(page_contents.url)
# It prints the same.

标签: pythonurlxpath

解决方案


你说你有一组链接。如果它们都与您给出的示例格式相同,假设链接位于名为 的文件中links.txt,那么您可以使用此功能仅取出 google drive 链接:

import re

with open("links.txt", "r") as file:
    contents = file.read()

def getUrl():
    indexes = [x.start() for x in re.finditer("_", contents)]
    urloutput = ""

    for i in range(indexes[0], indexes[1]):
        urloutput += contents[i + 1]

    return(urloutput)

根据列表中 url 的格式,您需要修改它以遍历 url 的每个实例并每次使用该函数。


推荐阅读