首页 > 解决方案 > 如何在 scala 中加载加权图?

问题描述

似乎没有内置方法graphx可以正确加载加权图。我有一个文件,其中的列代表图形的边缘:

# source_id target_id weight
0   1   1
1   2   2
2   3   3
3   4   4
4   5   5
5   0   6

如何graphx.Graph正确加载它?

标签: scalaapache-sparkspark-graphx

解决方案


我不熟悉 GraphX,但这里有一个手动的方法来做到这一点。这有点难看,但无论如何它都能完成工作。我为每个顶点分配了一个属性“名称”,但您可以根据需要调整它。

import org.apache.spark.graphx._

val input = sc.textFile("edgefile.txt")
val header = input.first()
val rdd = input.filter(row => row != header).map(_.split("   ").map(_.toLong))
val edges = rdd.map(s => Edge(s(0), s(1), s(2)))
val vertices = rdd.map(r => r(0)).union(rdd.map(r => r(1))).distinct.map(r => (r, "name"))
val graph = Graph(vertices, edges)

graph.vertices.foreach(println)
(3,name)
(1,name)
(2,name)
(0,name)
(4,name)
(5,name)

graph.edges.foreach(println)
Edge(0,1,1)
Edge(1,2,2)
Edge(2,3,3)
Edge(3,4,4)
Edge(4,5,5)
Edge(5,0,6)

推荐阅读