r - R igraph edgelist to adjacency matrix 如何修剪0块?
问题描述
我有一个包含 3 列的边缘列表,类似于 From、To、Weight,但它没有行/列名称。
A1 B1 0.3
A1 B2 0.2
A1 B3 0.1
A2 B1 0.3
A2 B2 0.2
A2 B3 0.3
... ...
更多细节: Col 1 只有“Ax”,col 2 只有“Bx”,它们是不同的类型。在 Ax 和 Bx 内永远不会有真正的十字架,例如,永远不会有像这样的行
A1 A3 0.2
此外,生成的邻接矩阵应该是完全正方形的,A 的数量与 B 的数量完全相同,并且每个 A 恰好映射到每个 B,反之亦然。
在其他stackoverflow线程之后,我申请了
library(igraph)
gdf <- graph.data.frame(edgelist)
adj_mat <- get.adjacency(gdf, sparse = FALSE, attr='X3')
然而,这个输出充满了 Ax-Ax 和 Bx-Bx 对,即
A1 A2 A3
A1 0 0 0
A2 0 0 0
A3 0 0 0
在继续之前(这也是我想要的结果,没有前导和尾随的 0 块)
... A1 A2 A3
B1 0.3 0.3 ...
B2 0.2 0.2 ...
B3 0.1 0.3 ...
后面是一大块 0 和 Bx-Bx 十字架。
所以这个矩阵大约是它需要的大小的 3 倍。
我在 R 中的实际 adj_mat 输出,以防这有帮助:
query_0 query_1 query_2 query_3 query_4 query_5 query_6 query_7 reference_B reference_CD4_T
query_0 0 0 0 0 0 0 0 0 0.9211076 0.9357135
query_1 0 0 0 0 0 0 0 0 0.5982098 0.6531529
query_2 0 0 0 0 0 0 0 0 0.9414440 0.9163261
query_3 0 0 0 0 0 0 0 0 0.7776452 0.7595893
query_4 0 0 0 0 0 0 0 0 0.1742785 0.4535070
query_5 0 0 0 0 0 0 0 0 0.8929904 0.8692392
query_6 0 0 0 0 0 0 0 0 0.8727388 0.9143452
query_7 0 0 0 0 0 0 0 0 0.6672841 0.7709745
reference_B 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD4_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD8_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_DC 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_Mono 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_NK 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_other 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_other_T 0 0 0 0 0 0 0 0 0.0000000 0.0000000
reference_CD8_T reference_DC reference_Mono reference_NK reference_other reference_other_T
query_0 0.9795670 0.9616339 0.2036382 0.9735171 0.9868448 0.9683900
query_1 0.9581395 0.9263749 0.8985018 0.8132070 0.7481512 0.9580464
query_2 0.4993608 0.3923397 0.9837582 0.9125077 0.9859413 0.9322740
query_3 0.9069418 0.8334141 0.9652273 0.1926747 0.9856065 0.9556887
query_4 0.9415359 0.8987213 0.9075660 0.7965302 0.9804007 0.9542930
query_5 0.3971887 0.5269301 0.9410492 0.9178430 0.9854246 0.6326137
query_6 0.9752365 0.9528309 0.9084781 0.9701409 0.9274201 0.9644051
query_7 0.9712323 0.9535511 0.9000940 0.9376305 0.8200538 0.9356329
reference_B 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_CD4_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_CD8_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_DC 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_Mono 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_NK 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_other 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
reference_other_T 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000
在这种特殊情况下,我可以得到我想要的结果
adj_mat<- adj_mat[, -c(1:8)]
adj_mat<- adj_mat[-c(9:16),]
但我希望找到更普遍的东西。
我不必严格使用igraph
包,我愿意使用任何其他包将边缘列表转换为邻接矩阵,甚至只是魔术数据争吵。
解决方案
你可能需要xtabs
> xtabs(Weight ~ ., df)
To
From B1 B2 B3
A1 0.3 0.2 0.1
A2 0.3 0.2 0.3
或者
> as.data.frame.matrix(xtabs(Weight ~ ., df))
B1 B2 B3
A1 0.3 0.2 0.1
A2 0.3 0.2 0.3
数据
> dput(df)
structure(list(From = c("A1", "A1", "A1", "A2", "A2", "A2"),
To = c("B1", "B2", "B3", "B1", "B2", "B3"), Weight = c(0.3,
0.2, 0.1, 0.3, 0.2, 0.3)), class = "data.frame", row.names = c(NA,
-6L))
推荐阅读
- excel - 循环以根据另一个单元格文本更改正数或负数
- java - Java 中的大数据库调用 + 解析 VS 许多数据库调用
- javascript - 如何确保此函数将返回一个没有任何重复项且不减少元素数量的数组?
- python - SNPE - 如何预测具有两个(或更多)输入的模型?
- excel - 执行 While 循环以打开多个工作簿、执行列比较宏、然后关闭工作簿并另存为新文件
- azure-cosmosdb - 从文档中提取的 PartitionKey 与 CreateItemAsync 标题中指定的不匹配
- wordpress - PHP 7.3 函数 create_function() 已弃用-
- python - scipy.stats.multivariate_normal 的 LinAlgError 奇异矩阵
- c# - 当 bot 托管在 microsoft azure 上时,我无法访问公司的数据库
- typescript - 省略对象的属性注释