首页 > 解决方案 > Scala、Spark-shell、Groupby 失败

问题描述

我有 Spark 2.4.0 版和 scala 2.11.12 版。我可以使用以下代码成功加载数据框。

val df = spark.read.format("csv").option("header","true").option("delimiter","|").option("mode","DROPMALFORMED").option("maxColumns",60000).load("MAR18.csv")

但是,当我尝试执行 groupby 以下操作时,出现错误。

df.groupby("S0102_gender").agg(sum("Respondent.Serial")).show()

错误信息是:

错误:值 groupby 不是 org.apache.spark.sql.DataFrame 的成员

我错过了什么。一个完整的 Scala 和 Spark Newb。

标签: scalaapache-sparkdataframespark-shell

解决方案


你有一个错字

改变

    groupby

    groupBy

推荐阅读