首页 > 解决方案 > 在使用 python 的 request.get() 之后,PDF 文件已损坏

问题描述

所以我有这个简单的代码,但每次我尝试打开下载的 pdf 文件时,它都会说它已损坏。它适用于我发现的大多数测试 PDF 文件,所以我知道,这个特定的存在问题,但我不知道如何解决它。

import requests

url = 'https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf'
r = requests.get(url)

with open('python.pdf', 'wb') as f:
    f.write(r.content)

标签: pythonpdfrequest

解决方案


访问该 URL 会重定向到该网页。它不下载pdf。

您要保存的python.pdf是网页的 HTML,这就是 PDF 阅读器认为它已损坏的原因。


推荐阅读