python-2.7 - Janusgraph 查询返回数据框以使用 GraphFrame 执行分析
问题描述
我使用 JanusGraph、HBase 和 Python(通过 gremlin_python)来创建和存储示例图。现在我想做一些图表分析(例如页面排名),并希望坚持使用 Python。我想知道是否可以从 JanusGraph 中以 DataFrame 格式查询图形,然后摄取到 GraphFrame 以计算 pageRank?
关键问题是如何使用 Python 在 JanusGraph + GraphFrame 之间架起桥梁,即 1. 查询以一种格式返回的图形 2. 调用 GraphFrame API 来计算 PageRank。
解决方案
就我而言,没有官方的连接器可用于将 JanusGraph 的查询结果转换为 Spark DataFrame(然后是 GraphFrame 中的 Graph)。
因此,您必须手动编写代码来执行转换。您可以使用gremlin-python
package 查询 JanusGraph,然后使用 Spark 将结果集提供给 Spark DataFrame
。