scala - SparkSQL 选择多列,然后加入?
问题描述
我不熟悉 sparksql,但想在此查询中选择多个列,然后加入 2 帧。主键列ID
来自 df。
val count1 = df.select(size($"col1").as("col1Name"))
val count2 = df.select(size($"col2").as("col2Name"))
所以最终我想要一张桌子ID, count1 and count2
。我怎样才能做到这一点?
解决方案
我相信你想要做的是从 df 中计算 2 列。您可以使用以下方法执行此操作
df.registerTempTable("temp_table")
//Below Is an example how you can use SparkSql
val newdf = spark.sql("select id,count(col1) as count1,count(col2) as count2 from temp_table group by id")
//You can use this dataframe further for operations
newdf.show(false)
推荐阅读
- node.js - 节点项目在带有 PM2 的 AWS EC2 实例上运行
- java - 在 Android 中更改可绘制对象的颜色
- c++ - 将对象传递给函数并访问其属性 [C++ & OpenGL)
- reactjs - 有没有办法覆盖材料ui griddata的行?因为我想在我的桌子上加一个手风琴
- android - 颤动中任务':app:stripDebugDebugSymbols'的执行失败
- java - 无法将 Hazelcast 4.2 版与 Spring Boot 2.3.6.RELEASE 集成
- slack - 为松弛组中的新用户配置消息
- android - 如何提高积压的 Android WorkManager 的性能?
- javascript - 尝试使用套接字 IO 服务器制作电子 appp 交易消息
- html - 为什么 iframe 仅在 iOS 中为空白?