gremlin - 用 project() 和 select() 在 Gremlin 中总结路径信息
问题描述
我正在尝试编写一个 Gremlin 查询,该查询将遍历多个顶点并返回叶子以及有关到达那里所遵循的路径的一些信息。
用一个例子来解释是最简单的:
# Sample graph diagram
# 1 --> 2* --> 3* --> 4
# \ \---> 5* --> 6
# \-> 7
# Create sample graph
g.addV('V').as('1').property('id','1').property('notable',false)
.addV('V').as('2').property('id','2').property('notable',true)
.addE('E').from('1')
.addV('V').as('3').property('id','3').property('notable',true)
.addE('E').from('2')
.addV('V').as('4').property('id','4').property('notable',false)
.addE('E').from('3')
.addV('V').as('5').property('id','5').property('notable',true)
.addE('E').from('2')
.addV('V').as('6').property('id','6').property('notable',false)
.addE('E').from('5')
.addV('V').as('7').property('id','7').property('notable',false)
.addE('E').from('1')
以下遍历从顶点 1 开始并out()
尽可能继续,使用 . 收集“显着”顶点as()
。
g.V('1')
.out()
.until(out().count().is(0))
.repeat(
optional(has('notable', true).as("notables"))
.out()
)
.project('Id','NotableAncestors')
.by(id())
.by(coalesce(
select('notables').unfold().id(), inject([])
))
我想看到的是每个叶子的 ID 及其“显着”祖先的 ID 数组:
[
{
"Id": "7",
"NotableAncestors": []
},
{
"Id": "4",
"NotableAncestors": ["2", "3"]
},
{
"Id": "6",
"NotableAncestors": ["2", "5"]
}
]
但是,NotableAncestors
我得到的不是数组,而是第一个值,因为unfold()
将数组展平为其中的第一项,如下所示。或者,如果我省略unfold()
,我会得到一个数组,但它总是空的。
[
{
"Id": "7",
"NotableAncestors": []
},
{
"Id": "4",
"NotableAncestors": "2"
},
{
"Id": "6",
"NotableAncestors": "2"
}
]
解决方案
我认为你可以简化一点。首先请注意,这as()
是一个步骤标签,您可以参考它来检查遍历中特定点处该步骤中的遍历器是什么,因此它并不是真正“收集”东西。这是另一种方法:
gremlin> g.V('1').
......1> repeat(out()).
......2> emit(outE().count().is(0)).
......3> project('Id','NotableAncestors').
......4> by(id()).
......5> by(path().unfold().has('notable',true).id().fold())
==>[Id:7,NotableAncestors:[]]
==>[Id:4,NotableAncestors:[2,3]]
==>[Id:6,NotableAncestors:[2,5]]
我删除了一堆额外的步骤,并简单地out()
从顶点“1”反复遍历,只发出你关心的叶子顶点。然后,我只分析path()
任何“显着”顶点的叶子,并将它们添加到List
“NotableAncestors”`。