首页 > 解决方案 > 如何将 spark mllib word2vec 模型转换为 glove txt 格式?

问题描述

我使用 Spark MLlib 来训练特定领域的 word2vec 模型,我需要以 glove word2vec 格式使用它。如何将其转换为手套 txt 格式?

标签: apache-sparkapache-spark-mllibword-embeddingglove

解决方案


在 SparkShell 中尝试了一下之后,我发现下面的代码对我有用:

val vectors = model.getVectors
val writer = new BufferedWriter(new FileWriter(file))
vectors foreach ( entry => writer.write(entry._1 + " " +   entry._2.mkString(" ") + "\n") )

推荐阅读