首页 > 解决方案 > Janusgraph 查询返回数据框以使用 GraphFrame 执行分析

问题描述

我使用 JanusGraph、HBase 和 Python(通过 gremlin_python)来创建和存储示例图。现在我想做一些图表分析(例如页面排名),并希望坚持使用 Python。我想知道是否可以从 JanusGraph 中以 DataFrame 格式查询图形,然后摄取到 GraphFrame 以计算 pageRank?

关键问题是如何使用 Python 在 JanusGraph + GraphFrame 之间架起桥梁,即 1. 查询以一种格式返回的图形 2. 调用 GraphFrame API 来计算 PageRank。

标签: python-2.7apache-sparkapache-spark-sqlgremlinjanusgraph

解决方案


就我而言,没有官方的连接器可用于将 JanusGraph 的查询结果转换为 Spark DataFrame(然后是 GraphFrame 中的 Graph)。

因此,您必须手动编写代码来执行转换。您可以使用gremlin-pythonpackage 查询 JanusGraph,然后使用 Spark 将结果集提供给 Spark DataFrame


推荐阅读