python - pandas.read_parquet 在 Azure databricks 笔记本中返回“IsADirectoryError”
问题描述
当我执行 pd.read_parquet("/dbfs/XX/XX/agg.parquet") 以访问 databricks 的 dbfs 中名为 agg 的镶木地板文件时,它返回 'IsADirectoryError'。尽管当我使用 dbutils 列出该文件时,该文件显示为一个文件夹,但我认为 Spark 可以将其作为文件读取,因此它适用于 spark 读取。pandas read_parquet 模块似乎使用了 fastparquet 后端,所以 fastparquet 可能是它引发错误的原因吗?
解决方案
推荐阅读
- java - spring.session.timeout 与 server.servlet.session.timeout
- c# - C#/MSHTML - HTMLInputElement click() 方法在“文件”类型的输入元素上使用时陷入无限循环
- aem - 按照命名模式在 AEM 6.3 中删除多个页面
- spring - 如何使用spring kafka批处理监听器进行有状态重试
- c# - 使用 shcemas.microsoft.com/windows/2004/02/mit/task.xsd 创建类时,xsd.exe 会出错
- docker - docker容器中的Python写权限被拒绝
- c# - 如何在不将服务注入构造函数的情况下获取服务实例
- java - 评估传递给从另一个类调用的模拟方法的参数
- javascript - 即使 Aurelia 中的代码正确,服务人员也在工作
- c - 联合在使用不同格式说明符时表现不同