scala - Scala IDE 中的 Spark SaveAsTextFile() 创建“temporay->0”文件夹结构,而不是函数中提到的那个
问题描述
使用 Scala IDE 将输出保存在具有以下代码的文件中
import org.apache.spark.sql.SparkSession
object RDDWithCSVFile {
def main(args : Array[String]): Unit={
val spark=SparkSession.builder()
.appName("Creating RDD with CSV Files")
.master("local")
.getOrCreate()
val rdd= spark.sparkContext.textFile("src/test/resources/datasets/CDH_Wellness.csv")
val header=rdd.first()
val csvwithoutheader= rdd.filter(!_.contains(header))
val elements= rddwithoutheader.map(line => {
val colarray = line.split(",")
Array((colarray(0),colarray(4),colarray(5),colarray(10))).mkString(" ")
})
elements.saveAsTextFile("C:/Spark_Files/RDDWithCSVFile/New Folder")
}
}
但不是创建输出文件-> part-00000,SUCCESS ,而是创建以下文件夹结构
C:\Spark_Files\RDDWithCSVFile\New Folder_temporary\0_temporary\attempt_20200526184311_0006_m_000000_0
在此目录下,仅创建了 part-00000,但它是一个空文件。没有创建 SUCCESS 文件。
任何人都可以提供任何建议。
解决方案
引起:java.io.IOException: (null) entry in command string: null chmod 0644 C:\Spark_Files\RDDWithCSVFile\New Folder_temporary\0_temporary\attempt_20200527112424_0006_m_000000_0\part-00000
控制台错误
推荐阅读
- c# - 正则表达式替换除大小写“{0}”之外的所有花括号
- c# - 关于财产变更
- javascript - Vuejs - 基于其他计算属性的计算属性
- mongodb - Mongodb 聚合性能和可扩展性
- android - 使用文本时钟作为项目的回收器视图上的空指针异常
- css - Ipad Pro 高度不对齐
- java - 如何将方法 StageHelper.getStages() 从 java 1.7 替换为 java 11
- javascript - 如何在 nuxt 中制作 *.vue 文件
- android - 使用 EditText 过滤 ListView
- wordpress - 如何在不裁剪的情况下调整 WooCommerce 图像的大小?