首页 > 解决方案 > 如何重新调整绘图以将集群(节点)推得更远,并在 igraph 中命名集群?

问题描述

我有节点和边缘信息,并试图用它制作网络图。节点信息有 1552 行信息:

边缘信息有四列,有 1203576 个条目。

使用我在下面的代码中使用的节点和边数据来制作网络图。

library(igraph)
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)

plot(net, edge.arrow.size=.4,vertex.label=NA, 
     vertex.color=as.numeric(factor(nodes$type)))

Grouped.net = net
E(Grouped.net)$weight = 1

colnames(nodes)[4] <- "Clusters"

## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
  GroupV = which(nodes$Clusters == Clus)
  Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
} 


## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)

# Generate colors based on media type:
colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]


plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, asp=0, vertex.size=4)
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

我得到的情节如下所示:

在此处输入图像描述

上图中有5个簇。

  1. 如何增加集群之间的空间?如何将它们移远?以及如何调整边缘?他们看起来很奇怪。

  2. 图中的簇如何命名?

  3. 如何将节点 typeC 带到顶部?他们的数量很少。由于 typeA 的数量很大, typeC 在下面。

标签: rgraphigraphnetwork-analysis

解决方案


你有几个问题。我将尝试回答所有问题,但顺序不同。

设置

library(igraph)
edges = read.csv("temp/edges_info_5Clusters.csv", stringsAsFactors=T)
nodes = read.csv("temp/nodes_info_5Clusters.csv", stringsAsFactors=T)

问题 3.如何将节点 typeC 置顶?
节点按节点编号的顺序绘制。为了显示不常见的类型,我们需要这些节点来获得最高的节点编号。所以只需对类型进行排序以强制节点按 TypeA、TypeB、TypeC 的顺序排列。

nodes = nodes[order(nodes$type),]
net <- graph_from_data_frame(d=edges, vertices=nodes, directed=F)

我将直接转到您在代码中的分组绘图以显示结果。

Grouped.net = net
E(Grouped.net)$weight = 1
colnames(nodes)[4] <- "Clusters"

## Add edges with high weight between all nodes in the same group
for(Clus in unique(nodes$Clusters)) {
  GroupV = which(nodes$Clusters == Clus)
  Grouped.net = add_edges(Grouped.net, combn(GroupV, 2), attr=list(weight=500))
} 

## Now create a layout based on G_Grouped
set.seed(567)
LO = layout_with_fr(Grouped.net)

colrs <- c("gray50", "yellow", "tomato")
V(net)$color <- colrs[V(net)$type_num]

plot(net, layout=LO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
    edge.color="lightgray")
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

网络图 - 版本 1

好的,现在 TypeC 和 TypeB 更明显了,但是五个集群的布局很差。为了得到更像你的第二个(示例)图的东西,我们需要分层构建布局:首先布局集群,然后分别布局集群内的点。五个集群的布局很简单。

F5 = make_full_graph(5)
Stretch = 6
LO_F5 = Stretch*layout.circle(F5)
plot(F5, layout=LO_F5)
 

集群布局

现在我们需要对每个集群中的点进行布局,并使用刚刚创建的集群布局将它们隔开。但这里有一个权衡。如果你让集群相距很远,所有的节点都会很小而且很难看到。如果您希望节点更大,则需要使集群更靠近在一起(以便它们都适合图)。你有这么多链接,无论你做什么,链接都会像灰色背景一样模糊在一起。我选择了一个吸引我的中间立场,但我邀请您探索该因素的不同值Stretch。较大的值Stretch将使集群与较小的节点相距更远。较小的值将使集群与较大的节点更接近。选择适合你的东西。

set.seed(1234)
HierLO = matrix(0, ncol=2, nrow=vcount(net))
for(i in 1:length(levels(nodes$Clusters))) {
    CLUST = which(nodes$Clusters == levels(nodes$Clusters)[i])
    SubNet = induced_subgraph(net, V(net)[CLUST])
    LO_SN = scale(layout_nicely(SubNet))
    HierLO[CLUST, ] = LO_SN + 
        matrix(LO_F5[i,], nrow=vcount(SubNet), ncol=2,byrow=TRUE)
}

plot(net, layout=HierLO, edge.arrow.size=0,vertex.label=NA, vertex.size=4,
    edge.color="lightgray")

网络图 - 第 2 版

您现在可以看到所有的 TypeC 节点和大部分的 TypeB(除了在集群 1 中有很多 TypeB)。

最后,让我们添加集群标签。这些只需要相对于集群中心放置。这些中心是由布局LO_F5给出的,但 igraph 绘图会重新调整布局,以便绘图实际上具有范围 (-1,1)。我们可以自己重新调整 LO_F5 的大小,然后稍微拉伸位置,使标签刚好位于圆外。

LO_Text = LO_F5
LO_Text[,1] = 2*(LO_F5[,1] - min(LO_F5[,1]))/(max(LO_F5[,1]) - min(LO_F5[,1])) -1
LO_Text[,2] = 2*(LO_F5[,2] - min(LO_F5[,2]))/(max(LO_F5[,2]) - min(LO_F5[,2])) -1
text(1.2*LO_Text, labels=levels(nodes$Clusters))
legend(x=-1.5, y=-1.1, c("typeA","typeB", "typeC"), pch=21,
       col="#777777", pt.bg=colrs, pt.cex=2, cex=.8, bty="n", ncol=1)

网络图 - 第 3 版

链接仍然是一个问题,但我认为这解决了您的其他问题。


推荐阅读