indexing - Apache Solr - 需要两次索引相同的文档才能使纯文本查询正常工作
问题描述
我有一个包含 76000 个大 json 文档的数据集。我用 post.jar 将它索引到 solr
java -jar -Dc=sampleindex -Dauto example/exampledocs/post.jar "/home/sample/sample.json"
我可以看到 76000 个文档在 solr UI 仪表板中被索引。我可以对索引进行字段基础搜索,如下所示
如果 customer_name 是该字段之一,我可以搜索
http://localhost:8983/solr/sampleindex/select?fl=customer_name&q=customer_name%3Arachel
我从 solr 得到结果。但是,当我只使用(纯文本)搜索时
http://localhost:8983/solr/sampleindex/select?q=rachel
我没有得到任何结果。
我需要再次索引 76000 个文档,现在总文档数为 152000
现在,如果我用纯文本“rachel”搜索
http://localhost:8983/solr/sampleindex/select?q=rachel
我得到结果。
我不确定我的索引方式是否有问题。
解决方案
推荐阅读
- python - OpenCV - 轮廓未检测到 jpg 中的正方形
- python - 如何在字符串格式中对十六进制进行对齐
- flutter - 将数据从一个小部件传递到另一个小部件
- java - 为什么尝试在 Java 中拆分字符串时出现空字符串?以及如何解决?
- mongodb - $multiply 在 $project 字段中提供 null
- django - Python 3.7 AttributeError:“str”对象没有属性“has”
- php - 传递给 Laravel 函数的参数太少
- oracle - 如何为成千上万的人使用不同的组分隔符。甲骨文
- html - 为什么阿拉伯语 Noto 字体(或其他阿拉伯语字体)在 HTML / CSS 中呈现不正确?
- c# - 尝试通过 C# API 订阅时,主题到队列映射失败