首页 > 解决方案 > Spark ML 将计数映射转换为特征

问题描述

我在特定位置有一个 Scala Map of seenCounts,例如:

Map(beach -> 31, cafe -> 140, prison -> 2)

我应该如何将这种类型的数据转换为机器学习的特征?

目前,我构建了一个 List[String] 项目并使用 CountVectorizer 将其转换为特征,但是我正在丢失特定位置的频率信息。我不想泄露这些信息。

标签: feature-extractionapache-spark-ml

解决方案


推荐阅读