python - 如何将竞争词而不是单个词输入到fasttext模型
问题描述
我将 fasttext 用于单词相似性目的。我输入了一个 txt 文件,其中每一行都有一个单词。文本格式为字符串。
例如:iphone 8 \n apple hkd \n billie jean jh audio \n anafi fcc 模式 \n smartone 促销 \n zenfone 5 价格 \n 智能手机品牌 \n
但是当我将“iphone”输入到训练模型以获得相似度结果时,它会返回一个单词,例如:
('买iphone', 0.7245190143585205), ('"iphone', 0.6674467325210571), ('iphone.', 0.6550431251525879), ('piphone', 0.6026722192764282), ..... ('xs', 0.38544)7301 iph0ne', 0.37973055243492126), ('混合', 0.3791016936302185), ('手机', 0.37475910782814026), ('xr', 0.3736417889595032)
我希望输出应该完成像“iphone 8”、“iphone xr”这样的单词。
解决方案
推荐阅读
- php - Symfony DOM Crawler 显示当前节点列表为空
- airflow - 气流传感器超时时如何执行某些操作
- android - NotificationCompat.Builder 中的 setTimeoutAfter 不起作用
- android - 如何在 Android 中为 Graffiti 应用程序创建滴水喷雾罐工具
- docker - 为什么 Gitlab-CI 有时会使用 root 所有者创建项目目录(但我指定了另一个用户)以及如何解决它?
- authentication - 在整个应用程序中登录不是持久的 YII2
- java - 从插件目录将 jars 添加到 Docker 映像
- apache-spark - 运行总和/累积总和与地板和天花板 Py Spark
- scala - 如何在火花中将数据集 [行] 保存为文本文件?
- python - 使用 Numpy Array 遍历 .txt 文件中的时间序列数据