python - 将 python 请求响应加载到 tabula.read_pdf
问题描述
我有一个下载 pdf 作为响应的 URL。我想使用 python请求模块下载 pdf 文件,并希望在tabula模块的函数read_pdf中加载相同的响应,以便从 pdf 文件中提取 pdf。但是,我想在内存中执行此操作(而不保存在磁盘中),但read_pdf函数需要一个参数input_path,它应该是 str、路径对象或类似文件的对象)。谁能建议一种将响应对象转换为类文件对象的方法?
PS:
- 我已经尝试过io模块的BytesIO和StringIO但没有用。
- 在tabula doc 中提到了一个指向 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有任何方法可以在read_pdf中传递所有这些参数,则可以使用请求模块轻松完成可以做到的功能。
解决方案
推荐阅读
- javascript - 错误:无法从“/home/dolphin/sync/source/cruise-web”找到模块“@babel/plugin-proposal-decorators”
- javascript - 为什么这段代码会抛出“谷歌未定义”错误以及“TypeError:无法读取初始化时未定义的属性“PlacesService”-错误?
- git - GIT 定义简单的冲突解决策略
- java - 二叉搜索树选择方法实现
- python - 如何获取 3d np 数组的 np.amin 的索引?
- php - 改变woocommerce产品库的风格
- java - 如何使用springboot检查用户是否已添加到LDAP组
- java - 版本 9.4.34.v20201102 的 Jetty ServletTester 类
- c++ - 某些类型的右值和左值实例的 C++ 类型转换运算符的意外行为
- java - ConfigFileApplicationListener 已弃用,只能用作 EnvironmentPostProcessor