scala - 在火花数据帧中使用 $"col" 而不是 "col" 的优势是什么
问题描述
假设我创建了一个 DF,如下所示
val posts = spark.read
.option("rowTag","row")
.option("attributePrefix","")
.schema(Schemas.postSchema)
.xml("src/main/resources/Posts.xml")
posts.select("Id")
使用over将其转换为 Column 有什么好处posts.select($"Id")
解决方案
df.select
在$"col"
创建 Column 实例时直接对列进行操作。您还可以使用col
函数创建 Column 实例。现在可以组合列以形成复杂的表达式,然后可以将其传递给任何 df 函数。
您还可以在 Scaladoc of Column 类中找到示例和更多用法。
参考 - https://spark.apache.org/docs/2.2.0/api/scala/index.html#org.apache.spark.sql.Column
推荐阅读
- list - 如何在方案/球拍上做一个乘法表
- c# - 我们可以在 EF Query Where 子句中使用 ValueObjects 吗?
- algorithm - 如何将此算法放入编程语言(Python)中
- java - 使用 MAVEN 在 Databricks Spark Scala AWS 中解析 XML - DailyMed 的 HL7 V3 文件
- imagemagick - ImageMagick Montage:设置图像大小和页面大小
- flutter - 列表的空安全?来自 GET http 请求的不可为空的 Json 映射
- sql - 取消连接列 SQL
- recaptcha - reCaptcha 导致 WordFence 出现问题 - 不想激活 2FA 并且 reCaptcha 分数低 (0.5)
- ios - 显示 int 数组列表的优雅方式
- javascript - 当用户在Vue中注销时重定向到登录页面