首页 > 解决方案 > 从 Google Cloud Storage 读取 PDF

问题描述

我目前在 Google Cloud Storage 中有一个带有 .pdf 文件的存储桶,我想将每个 .pdf 文件拆分为多个单页 .pdf 文件。

我只能将文件加载为 BLOB(<class 'google.cloud.storage.blob.Blob'>),并且我找不到关于如何读取为 PdfFileReader 对象的好答案。

标签: pythonpdfgoogle-cloud-functionsgoogle-cloud-storage

解决方案


从存储桶中“获取”对象/文件后,您可以将其作为字符串(字节)“保存”在云函数内存中,或将其保存到/tmp云函数本地的临时“目录”(该临时目录是从云功能可用的总内存中分配的)。之后,您可以将数据作为字符串或文件进行处理。完成处理后,您可能希望将这些文件上传到其他存储桶中。


推荐阅读