首页 > 解决方案 > 将 python 请求响应加载到 tabula.read_pdf

问题描述

我有一个下载 pdf 作为响应的 URL。我想使用 python请求模块下载 pdf 文件,并希望在tabula模块的函数read_pdf中加载相同的响应,以便从 pdf 文件中提取 pdf。但是,我想在内存中执行此操作(而不保存在磁盘中),但read_pdf函数需要一个参数input_path,它应该是 str、路径对象或类似文件的对象)。谁能建议一种将响应对象转换为类文件对象的方法?

PS

  1. 我已经尝试过io模块的BytesIOStringIO但没有用。
  2. tabula doc 中提到了一个指向 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有任何方法可以在read_pdf中传递所有这些参数,则可以使用请求模块轻松完成可以做到的功能。

标签: pythonpython-3.xpython-requeststabulatabula-py

解决方案


推荐阅读