apache-spark - 使用 Java 在 Spark 中进行映射
问题描述
我有一个文件名myFile,格式如下:
1,A,2,B
1,A,3,C
2,B,4,D
我想将每行的第二个索引值映射到行本身:
A -> 1,A,2,B
A -> 1,A,3,C
B -> 2,B,4,D
如何使用 Spark Java 实现这一目标?
解决方案
这就是我实现它的方式
JavaPairRDD<String, String> pairs = myFile.mapToPair(s->new Tuple2<>(s.split(",")[1], s));
推荐阅读
- ios - 如何在其 isAccessibilityElement = false 时禁用元素的可访问性焦点
- css - 通过使用 css 在 ReactJS 中悬停另一个图像来隐藏图像
- python-3.x - python迭代多个文件
- reactjs - 获取 url 的数组
- visual-studio-2017 - Visual Studio 2017:规则集不会执行
- html - 在透明固定元素下滚动
- laravel - 无法发送没有发件人地址的消息laravel中的错误
- c - 使用文件在 C 中登录系统
- javascript - 如何使用 WYSIWYG 呈现 DatoCms 降价文本?
- arrays - 将数据从 SSBO 复制到数组