gremlin - Datastax 中的 Gremlin count() 查询太慢
问题描述
我在 datastax 企业中有 3 个节点,并在这些节点上加载了 6500 万个顶点和边。当我使用 dse studio 或 gremlin 控制台并在我的图表上运行 gremlin 查询时,查询太慢了。我定义了任何类型的索引并再次测试但没有效果。当我运行查询例如“gv().count()”时,cpu使用率和cpu负载平均值没有太大变化,而如果我运行cql查询,则分布在所有节点上,所有节点上的cpu使用率和cpu负载平均值是一个重大变化在这种情况下,高效 gremlin 查询的最佳实践或最佳配置是什么?
解决方案
count()
对于您正在使用的大小的图形,应通过带有 Spark 的 OLAP 执行基于遍历的操作。如果您使用基于标准 OLTP 的遍历,则此类查询的等待时间可能会很长。
请注意,此规则适用于任何必须进行“表扫描”的图形计算(即触摸图形中的所有或很大一部分顶点/边)。此问题也并非特定于 DSE Graph,几乎适用于任何图形数据库。
推荐阅读
- c# - 如何在 Entity Framework Core 中创建组合键,它是基类和派生类的组合
- javascript - 从标题中反应本机调用屏幕功能
- neo4j - 在 Sprint Neo4j 中通过 @Query 加载实体的“孩子”时遇到问题
- assembly - MASM 中的宏是什么?
- java - 根据受信任的证书验证证书
- html - 如何对齐我的表格,使它们看起来像这样?
- powershell - Connect-MsolService:接收到 https://provisioningapi.microsoftonline.com/provisioningwebservice.svc 的 HTTP 响应时出错
- latex - 在英语和法语中使用 algorithm2e
- java - 检查用户是否使用 Firebase Auth 和数据库首次登录 Android 应用程序
- javascript - TypeError:警报不是函数