java - 如何在 Java 中附加两个具有不同列的 Spark 数据帧
问题描述
我有一个数据帧,我正在其上执行一个 UDF 操作,然后 UDF 的操作在数据帧中只给出一列。我如何将它附加到以前的 Datafram。示例:数据框 1:sr_no、姓名、薪水
Dataframe 2:UDF 将输出作为 ABS(Salary) - 只有一列作为 UDF 的输出应用于 Dataframe1
我如何在 JAVA 中将输出数据帧作为 Dataframe1 + Dataframe2 即 sr_no、姓名、薪水、ABS(薪水)输出
解决方案
看起来您正在寻找.withColumn
方法:
df1.withColumn("ABS(salary)", yourUdf.apply(col("salary")))
(片段需要从导入静态col
方法org.apache.spark.sql.functions
)
推荐阅读
- .net - 什么是 StickyLabel,为什么它位于 ContextMenuStrip.Contols 集合中?
- swift - @propertyDelegate 和 @propertyWrapper 之间的区别
- c++ - 为什么这个 std::sort 比较失败?
- python - 如何使用 Python 重新加权以维持不同样本之间的协变量分布?
- kotlin - 为什么我不能在 .copyOf() 之后链接 .sort()?
- python - 如何从熊猫中提取特定的字符串?
- websphere - 访问被拒绝读取 java.util.Permissions
- unity3d - 无法在 Unity3D 上使用标准 NetworkManager(不是 MatchMaking!)在两个设备之间进行 UNET 工作
- vb.net - 由于“未声明”错误,无法调用 form_Load 事件,但名称正确且事件位于相应的类中
- javascript - document.querySelectorAll("a") 返回带有 # url 的空白节点列表