python - 在使用 python 的 request.get() 之后,PDF 文件已损坏
问题描述
所以我有这个简单的代码,但每次我尝试打开下载的 pdf 文件时,它都会说它已损坏。它适用于我发现的大多数测试 PDF 文件,所以我知道,这个特定的存在问题,但我不知道如何解决它。
import requests
url = 'https://link.springer.com/content/pdf/10.1007%2F978-3-662-58392-0.pdf'
r = requests.get(url)
with open('python.pdf', 'wb') as f:
f.write(r.content)
解决方案
访问该 URL 会重定向到该网页。它不下载pdf。
您要保存的python.pdf
是网页的 HTML,这就是 PDF 阅读器认为它已损坏的原因。
推荐阅读
- jquery - 如何使 jquery 滑块重复?
- java - 如果 Hibernate TypedQuery 以 ) 结尾,则升级到版本 5 后会失败
- python - Django - 获取相关集中的对象计数
- jquery - 如何获取属性值?
- c++ - 打印带类指针的函数模板的内容
- html - 我如何使我的行响应,以便在移动设备上它是垂直的?
- azure - 在 Azure ML 中将本地计算与 Estimator 结合使用
- visual-studio - 如何限制组织中的特定用户从我们的办公室 IP 外部访问 Azure DevOps
- android - Google WebRTC 是否支持 Cisco Open H.264?
- c# - 是否可以将短时区字符串作为 EST CET PST 转换为 C# 中的 TimeZoneInfo?