首页 > 解决方案 > ElasticSearch 可以接受预标记的内容并返回相应的 tf-idf 分数吗?

问题描述

我得到了一些中文材料,这些材料已经使用特定领域的标记器进行了精细标记。所以我通过在令牌之间添加空格来预处理它们,并希望将它们放入 es 集群中。我希望 es 可以在不使用其默认的中文分词器的情况下计算这些文档的 idf,并返回相应的分数。es 支持吗?我只是想利用 es 的出色性能,而不是它自己的分词器!

标签: elasticsearch

解决方案


当您选择一种被分析的映射类型时,例如文本弹性搜索将为您的查询生成一个分数。在您的情况下,您可以在索引映射中使用空白分析器。


推荐阅读