pyspark - 无法读取 pyspark 中的 csv 文件
问题描述
我是 pyspark 的新手,我做了一些初始教程。当我尝试使用 Jupyter Notebook 在 Spark 框架中的本地主机上加载 CSV 文件时,会弹出下面提到的错误。我的java版本是8.0
from pyspark.sql import SparkSession
spark = SparkSession \
.builder \
.appName('sql based spark data analysis') \
.config('spark.some.config.option', 'some-value') \
.getOrCreate()
df = spark.read.csv('C:/Users/sitaram/Downloads/creditcardfraud/creditcard.csv')
我的错误如下:
Py4JJavaError: An error occurred while calling o55.csv.
: org.apache.spark.sql.AnalysisException: java.lang.RuntimeException:
java.lang.RuntimeException: Error while running command to get file
permissions : java.io.IOException: (null) entry in command string: null ls -F C:\tmp\hive
at
org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:770)
at org.apache.hadoop.util.Shell.execCommand(Shell.java:866)
at org.apache.hadoop.util.Shell.execCommand(Shell.java:849)
at org.apache.hadoop.fs.FileUtil.execCommand(FileUtil.java:1097)
at org.apache.hadoop.fs.RawLocalFileSystem$DeprecatedRawLocalFileStatus.loadPermissionInfo(RawLocalFileSystem.java:65
Caused by: java.lang.RuntimeException: java.lang.RuntimeException: Error
while running command to get file permissions : java.io.IOException: (null) entry in command string: null ls -F C:\tmp\hive
解决方案
请试试C://Users//sitaram//Downloads//creditcardfraud//creditcard.csv
推荐阅读
- arrays - 当修剪和清除不起作用时删除数字中的空格
- java - 如何为接受文件作为参数的主要方法编写junit测试
- c# - 部署到 Ubuntu 18.04 的 ASP.NET Core 3.0 应用程序抛出无法加载文件或程序集 System.Diagnostics.TraceSource
- jquery - var 报告 r.fn.init(1) 中的 jQuery 目标 - 我试图比较的是同一个目标被点击了两次
- botframework - Bot 框架 v4 和自适应卡
- android - 在 android 8 及以上版本没有前台服务的情况下通过蓝牙连接激活 android 应用程序(android auto 会这样做)
- javascript - VueJS + Axios:在控制台选项卡与网络选项卡中修改获取的数据
- sql - 将查询转换为 SQL Server 语法
- php - NGiNX 配置为子文件夹上的 PHP 应用程序和 Angular 应用程序提供服务
- javascript - 如何在javascript中正确使用setInterval同步渲染数据?