首页 > 解决方案 > Apache Solr - 需要两次索引相同的文档才能使纯文本查询正常工作

问题描述

我有一个包含 76000 个大 json 文档的数据集。我用 post.jar 将它索引到 solr

java -jar -Dc=sampleindex -Dauto example/exampledocs/post.jar "/home/sample/sample.json"

我可以看到 76000 个文档在 solr UI 仪表板中被索引。我可以对索引进行字段基础搜索,如下所示

如果 customer_name 是该字段之一,我可以搜索

http://localhost:8983/solr/sampleindex/select?fl=customer_name&q=customer_name%3Arachel

我从 solr 得到结果。但是,当我只使用(纯文本)搜索时

http://localhost:8983/solr/sampleindex/select?q=rachel

我没有得到任何结果。

我需要再次索引 76000 个文档,现在总文档数为 152000

现在,如果我用纯文本“rachel”搜索

http://localhost:8983/solr/sampleindex/select?q=rachel

我得到结果。

我不确定我的索引方式是否有问题。

标签: indexingsolr

解决方案


推荐阅读