首页 > 解决方案 > MarkLogic 中的汉字处理

问题描述

我正在尝试搜索包含中文字符的文档。启用的索引是单词搜索、3 个字符搜索、快速短语搜索。在重新索引代码之前给出正确的结果,但在重新索引之后它没有给出预期的输出。

XML:

<root>
  <name xml:lang="en">Propylene</name>
  <name xml:lang="zh">丙烯</name>
</root>

搜索查询:

cts:search(collection('live'),
  cts:element-query(xs:QName('name'), 
    cts:word-query('丙烯', ("wildcarded", "whitespace-insensitive", "lang=zh"), 1)))

我希望结果集中有上述 XML,但重新索引后它不在结果集中。

其他语言的索引是否不同于 MarkLogic 中的“英语”?

标签: marklogicmarklogic-8

解决方案



推荐阅读