首页 > 解决方案 > 有没有办法在 ElasticSearch 中使用非文本字段来进行文档相似性,例如日期或整数?

问题描述

使用 ElasticSearch 的 more_like_this 功能,我了解了如何使用 tf-idf 或其他指标根据文本字段查找相似文档。但是,如果我的用例更像这样怎么办:

#   Name    Description    Price    Date
--------------------------------------------
1   A B C   Ba Bi Bou      100.0    12-01-18
--------------------------------------------
2   A B Z   Ba Bi Xon      250.0    01-11-11
3   X Y Z   Xa Xu Xon      100.0    12-02-18

仅基于文本字段,在与文档 #1 的相似性方面,文档 #2 的得分应高于文档 #3,因为文档 #3 的得分为 0。但是,考虑到“价格”和“日期”,文档 #3 的得分应该提高。

我可以用 ElasticSearch 做类似的事情吗?我发现的唯一文档处理文本字段。向 more_like_this 查询添加非文本字段不会导致任何异常,但分数完全不受影响。

标签: elasticsearchsimilarity

解决方案


推荐阅读