marklogic - MarkLogic 中的汉字处理
问题描述
我正在尝试搜索包含中文字符的文档。启用的索引是单词搜索、3 个字符搜索、快速短语搜索。在重新索引代码之前给出正确的结果,但在重新索引之后它没有给出预期的输出。
XML:
<root>
<name xml:lang="en">Propylene</name>
<name xml:lang="zh">丙烯</name>
</root>
搜索查询:
cts:search(collection('live'),
cts:element-query(xs:QName('name'),
cts:word-query('丙烯', ("wildcarded", "whitespace-insensitive", "lang=zh"), 1)))
我希望结果集中有上述 XML,但重新索引后它不在结果集中。
其他语言的索引是否不同于 MarkLogic 中的“英语”?
解决方案
推荐阅读
- excel - 在 If 和 For 上阻止失败
- jquery - 如何手动设置元素的 Id 并访问列表中具有相同 Id 的列表元素
- <\li> 标签?
- javascript - Jquery:显示/隐藏由 python for 循环创建的 Div
- r - 删除了 R 中包含缺失值 (geom_errorbarh) 的行
- gradle - 如何使用 Gradle 在 Netbeans 中运行单个文件?
- regex - 在 Ruby 中删除连字符周围的空格
- r - 使用 R 中的 list.files 删除列
- angular - 如何向我的 ngx-gallery 图像添加评论
- ios - 检查 AppDelegate 中的特定 VC
- python-3.x - 有没有办法在 docker 中使用 aws s3 作为文件系统?