marklogic - marklogic 删除重复的节点/元素
问题描述
我有数千个具有重复元素节点的文档。如何查找和删除title
XML 文件中的重复元素?
我使用fn:distict-values()
导致性能问题。
例如:01.xml
<doc>
<pdf>1</pdf>
<title>Head First JavaScript</title>
<title>Head First JavaScript</title>
</doc>
02.xml
<doc>
<pdf>0</pdf>
<title>Python: Programming Basics for Absolute Beginners </title>
<title>Python: Programming Basics for Absolute Beginners </title>
</doc>
结果:01.xml
<doc>
<pdf>1</pdf>
<title>Head First JavaScript</title>
</doc>
02.xml
<doc>
<pdf>0</pdf>
<title>Python: Programming Basics for Absolute Beginners </title>
</doc>
解决方案
嗨,请测试附加代码
let $doc :=
<doc>
<title>Head First JavaScript</title>
<title>Head First JavaScript</title>
<title>hellao</title>
<title>hello</title>
<title>hello</title>
<title>Python: Programming Basics for Absolute Beginners </title>
<title>ahello</title>
<title>Python: Programming Basics for Absolute Beginners </title>
</doc>
for $data in $doc//title[not(. = preceding-sibling::node())]
return $data
推荐阅读
- flutter - 在 Bloc 中颤振 NoSuchMethodError
- autohotkey - 在 IF 语句中使用多个 WinExists
- reactjs - React Router 没有在生产中的嵌套路由上加载资产
- python - Python 正则表达式多次替换两个字符串之间的文本,同时保留字符串
- ios - 模态 Segue 显示(推送)Segue LargeTitle 导航不起作用
- node.js - AWS CodeBuild 不生成构建文件夹 - NodeJS
- python - 将元组返回到字符串中,为什么它只返回元组列表的第一个索引?
- python - 从 jinja 模板中提取变量
- python - 在 Kivy 中使用 Build 时出现黑屏
- shell - grep 中包含的空文件:忽略它们或使用参数/管道将它们过滤掉更有效?