scala - 使用 spark scala 读取每一行的第二个单词
问题描述
我想阅读/打印每一行的第二个单词。
输入->>人们并不像他们看起来、
走路或说话时那么漂亮。
他们只有在爱的时候才会美丽,
在分享的时候在乎。
输出->> 他们是他们
解决方案
请检查:
val myDF=spark.read.text("<path>")
import org.apache.spark.sql._
import org.apache.spark.sql.types._
val rdd=myDF.rdd.map(_.mkString("")).map(f=> Row(f.split(" ")(1)))
val schema:StructType = (new StructType).add("values",StringType )
val result=spark.createDataFrame(rdd, schema)
result.show()
推荐阅读
- c - 以某种方式处理像素的方法
- reporting-services - 为什么 RowNumber 没有按预期工作?(报表生成器 3.0)
- doctrine - Symfony 学说:映射:转换过滤器不起作用
- python - 如何根据参数名称从字典中获取 Keras 层函数的参数值?
- testing - 如何判断一个测试用例(TFS 工作项)是否已经过测试?
- python - 如何按条件检测每列值的增加和减少?
- angular - Webpack 4 不允许出现“规则”错误
- python - 使用 Python Bottle 上传后的图像处理
- scrapy - Scrapy CrawlSpider - 从单个蜘蛛产生多个项目
- ubuntu - Gnuplot 错误:未定义符号:FT_Property_Set