java - ElasticSearchJSON 输出到镶木地板文件
问题描述
我正在以 JSON 格式读取 ElasticSearch 索引数据,并希望将其保存为镶木地板。下面是代码: ''' JavaPairRDD<String,String> esRDD = JavaEsSpark.esJsonRDD(jsc, "companydatabase/employees"); '''
如何将 JavaPairRDD<String,String> 转换为 Java 中的数据集。输出格式类似于 C1 JSON1 JSON2
解决方案
JavaPairRDD<String,String> esRDD = JavaEsSpark.esJsonRDD(jsc,esPath);
Dataset<Row> df = spark.createDataset(esRDD.collect(), Encoders.tuple(Encoders.STRING(),Encoders.STRING())).toDF("key","value");
df.write().mode("overwrite").save(ParquetPath);
推荐阅读
- ios - 如何在 SwiftUI 中通过按钮点击呈现菜单?
- java - java8中的ByteArrayOutputStream异常处理
- ios - 如何从字典数组中提取键值对?
- image - 在 iOS swift 中下载 .jp2 类型的图像
- python - 查找最多包含 K 个重复字符的最长子串的长度
- mysql - 根据所选选项过滤查询
- c# - 使用 C# 将数据从一个 dgv 复制到另一个具有值和计数的 dgv
- mongodb - 在官方 Go mongo-driver 中实现结构字段验证的方法是什么?
- python - 当 QLabel 的内容从另一个线程更新时,GIF 不动画
- chart.js - 对数 yaxsis 设置在 chartjs 中不起作用