首页 > 解决方案 > Datastax 中的 Gremlin count() 查询太慢

问题描述

我在 datastax 企业中有 3 个节点,并在这些节点上加载了 6500 万个顶点和边。当我使用 dse studio 或 gremlin 控制台并在我的图表上运行 gremlin 查询时,查询太慢了。我定义了任何类型的索引并再次测试但没有效果。当我运行查询例如“gv().count()”时,cpu使用率和cpu负载平均值没有太大变化,而如果我运行cql查询,则分布在所有节点上,所有节点上的cpu使用率和cpu负载平均值是一个重大变化在这种情况下,高效 gremlin 查询的最佳实践或最佳配置是什么?

标签: gremlindatastax-enterprise-graph

解决方案


count()对于您正在使用的大小的图形,应通过带有 Spark 的 OLAP 执行基于遍历的操作。如果您使用基于标准 OLTP 的遍历,则此类查询的等待时间可能会很长。

请注意,此规则适用于任何必须进行“表扫描”的图形计算(即触摸图形中的所有或很大一部分顶点/边)。此问题也并非特定于 DSE Graph,几乎适用于任何图形数据库。


推荐阅读