python - 从 Google Cloud Storage 读取 PDF
问题描述
我目前在 Google Cloud Storage 中有一个带有 .pdf 文件的存储桶,我想将每个 .pdf 文件拆分为多个单页 .pdf 文件。
我只能将文件加载为 BLOB(<class 'google.cloud.storage.blob.Blob'>),并且我找不到关于如何读取为 PdfFileReader 对象的好答案。
解决方案
从存储桶中“获取”对象/文件后,您可以将其作为字符串(字节)“保存”在云函数内存中,或将其保存到/tmp
云函数本地的临时“目录”(该临时目录是从云功能可用的总内存中分配的)。之后,您可以将数据作为字符串或文件进行处理。完成处理后,您可能希望将这些文件上传到其他存储桶中。
推荐阅读
- android - GitHub Gist API 限制
- php - 根据数据库可用性显示方面
- qt - 在 QML 中模糊背景
- flutter - Flutter:如何显示来自响应 API 的数据 HTML 结果?
- c# - 两个线程试图访问同一个列表:“System.ArgumentOutOfRangeException”
- jenkins - 启用 SAML 后 GitHub 挂钩触发器不起作用
- python - 如何将 Jupyter notebook 安装到 linux 虚拟机中
- javascript - 如何在 TradingView 轻量级图表中使用新数据更新图表
- r - 在R数据框中选择具有最大值的行及其信息
- amazon-web-services - 如何确保通过负载均衡器暴露在互联网上的网络服务器的安全性?