elasticsearch - 有没有办法在 ElasticSearch 中使用非文本字段来进行文档相似性,例如日期或整数?
问题描述
使用 ElasticSearch 的 more_like_this 功能,我了解了如何使用 tf-idf 或其他指标根据文本字段查找相似文档。但是,如果我的用例更像这样怎么办:
# Name Description Price Date
--------------------------------------------
1 A B C Ba Bi Bou 100.0 12-01-18
--------------------------------------------
2 A B Z Ba Bi Xon 250.0 01-11-11
3 X Y Z Xa Xu Xon 100.0 12-02-18
仅基于文本字段,在与文档 #1 的相似性方面,文档 #2 的得分应高于文档 #3,因为文档 #3 的得分为 0。但是,考虑到“价格”和“日期”,文档 #3 的得分应该提高。
我可以用 ElasticSearch 做类似的事情吗?我发现的唯一文档处理文本字段。向 more_like_this 查询添加非文本字段不会导致任何异常,但分数完全不受影响。
解决方案
推荐阅读
- python - 如何对字典列表进行算术运算
- tensorflow - 密集层 Keras 中的输出维度
- angular - 理解 Angular 中的 Interface 和 FormGroup 问题的问题
- airflow - 我想让一些任务每天运行,而另一些任务每周运行
- oracle - 在超过 100 万行的 xmltype 列上使用 updatexml 时出现 Oracle 内存错误
- android - 如何通过调用在高阶挂起函数中传递参数
- sql - 收集重复复合键的 SQL 查询
- javascript - Javascript正则表达式从字符串中删除字符
- python - 无法从 google collab 中的 python 文件导入 python 模块
- python-3.8 - encodlistknown=findencoding(images) encode=face_recognition.face_encodings(img)[0] Indexerror:list index out of range