python - 在 DBFS 中的 Databrisk 中从 python-pptx 保存 pptx
问题描述
我正在尝试使用包将 .pptx 文件保存到我的 Databricks 环境中的 DBFS,python-pptx
但收到以下错误:
[Errno 95] Operation not supported
当我运行prs.save('test.pptx')
它时,它运行没有错误,但我不明白它的去向。
任何指导将不胜感激。这是一个返回上述错误的示例:
prs = Presentation()
title_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(title_slide_layout)
title = slide.shapes.title
subtitle = slide.placeholders[1]
title.text = "Hello, World!"
subtitle.text = "python-pptx was here!"
prs.save('/dbfs/test.pptx')
解决方案
这是由DBFS Fuse 限制引起的,特别是缺乏对创建 PPTX 文件所需的随机写入的支持。解决方案是将文件写入本地文件系统,并在写入后移至 DBFS:
prs.save('/tmp/test.pptx')
dbutils.fs.mv('file:///tmp/test.pptx', '/test.pptx')
推荐阅读
- md5 - 如果字符串长度相等,则 sha & md5 冲突
- hyperledger-fabric - 当管理员证书即将过期时,如何为 Hyperledger Fabric 订购者/对等方续订管理员证书
- python - 如何在python中将分钟增加到当前时间
- javascript - 如何在不单击按钮的情况下在 React useEffect 中调用 Auth0 loginWithRedirect 函数?
- web-scraping - parsehub youtube 变灰了
- java - 使用 yum 或 wget 在 Linux(Azure) 上安装 OpenJDK 11
- python-3.x - 如何从 statsmodels AutoRegResults 中获取残差?model.resid 返回所有 NaN
- amazon-web-services - 无法从 terraform 数据源解析 cidr_block
- java - Python 与 Java 中的参数传递
- php - preg_replace_callback 只带 5 个参数?