首页 > 解决方案 > 如何在scala中减去两个向量?

问题描述

我有包含 id,特征原始数据的镶木地板文件。我想从重复值 2.484 中减去特征作为向量并将输出放在同一列(特征)中。作为标准化数据的 Z 分数,我想应用 (features-2.484)/1.830。

    val df = sqlContext.read.parquet("file:///usr/local/spark/dataset/model/data/user/part-r-00000-7d55ba81-5761-4e36-b488-7e6214df2a68.snappy.parquet").toDF("id","features")

    implicit class Rep(n: Int) {
    def times[A](f: => A): Seq[A] = { 1 to n map(_ => f) } 
    }

  val myHis = 13849.times { println("2.4848911616270923")}

如何将重复值作为向量并减去它?

标签: scalaapache-sparkvectornormalizationparquet

解决方案


推荐阅读