首页 > 解决方案 > 数据砖社区版无法读取上传的表(之前工作)

问题描述

所以当我今天在 DataBricks 社区版上尝试一些想法时,我突然发现 python pandas 不能再读取现有的上传表。这些目录以前可以工作,但我以前上传的表都不能再读取了,都以“ File ... Not Exist”返回。有谁知道我们能做什么?

使用的命令:

import pandas as pd
df = pd.read_csv('/dbfs/FileStore/tables/iris.csv')

文件肯定在那里,这也会影响我之前上传的所有其他文件。

数据库文件系统

在此处输入图像描述

任何建议将不胜感激

标签: pythonpandasdatabricksdatabricks-community-edition

解决方案


你是如何加载csv的?来自blob?如果来自 blob,您可能尚未安装。

您可以尝试阅读为火花吗?如果无法读取,则文件已损坏。如果可以,请尝试申请sdf.to.pandas()

sdf = spark.read.csv('/FileStore/tables/iris.csv', header="true", inferSchema="true")

推荐阅读