首页 > 解决方案 > 如何将竞争词而不是单个词输入到fasttext模型

问题描述

我将 fasttext 用于单词相似性目的。我输入了一个 txt 文件,其中每一行都有一个单词。文本格式为字符串。

例如:iphone 8 \n apple hkd \n billie jean jh audio \n anafi fcc 模式 \n smartone 促销 \n zenfone 5 价格 \n 智能手机品牌 \n

但是当我将“iphone”输入到训练模型以获得相似度结果时,它会返回一个单词,例如:

('买iphone', 0.7245190143585205), ('"iphone', 0.6674467325210571), ('iphone.', 0.6550431251525879), ('piphone', 0.6026722192764282), ..... ('xs', 0.38544)7301 iph0ne', 0.37973055243492126), ('混合', 0.3791016936302185), ('手机', 0.37475910782814026), ('xr', 0.3736417889595032)

我希望输出应该完成像“iphone 8”、“iphone xr”这样的单词。

标签: pythonsimilarityword-embeddingfasttext

解决方案


推荐阅读