feature-extraction - Spark ML 将计数映射转换为特征
问题描述
我在特定位置有一个 Scala Map of seenCounts,例如:
Map(beach -> 31, cafe -> 140, prison -> 2)
我应该如何将这种类型的数据转换为机器学习的特征?
目前,我构建了一个 List[String] 项目并使用 CountVectorizer 将其转换为特征,但是我正在丢失特定位置的频率信息。我不想泄露这些信息。
解决方案
推荐阅读
- jquery-select2 - 将标签设置为 true 的 Select2:选择选项后是否可以始终保留占位符?
- ios - 出现“无法为文件 (.MP4) 发出沙箱扩展名”错误
- jquery - Word press 分页类
- centos8 - 没有 CWP 的 CentOS 8 Cgroup(或 v2)安装
- c - DebugPrint 推送空行(串行连接)
- php - 当我尝试打印 openssl_csr_get_subject 的值时出错
- amazon-web-services - 指向 Elastic Beanstalk 环境的外部子域
- python - 在非常大的文件中查找以循环结尾的行(可能)
- excel - 如何将一个工作表中的列值引用到另一个工作表的每个第三列
- sql-server - 是否有在此查询中添加和计算时间的功能?