首页 > 解决方案 > 使用 TXT 文件和熊猫的 Python 邻接矩阵

问题描述

我想使用大量 .txt 文件构建一个 csv 邻接矩阵。我一直在尝试使用 panda 迭代地构建它,但遇到了 insert 函数的问题。txt文件格式为:

326869253   1386884701
326869253   7587032
326869253   11609972
49053573    7587032
18869940    7587032
...         ...        <-- example table ends here
18869940    35706421
200757425   7587032
801698222   7587032
18950342    7587032

如每行所述,矩阵将为 1:例如。除非稍后指定,否则列名 326869253 和行名 1386884701 处的单元格的值为 1,但列名 1386884701 和行名 326869253 处的单元格的值为 1。显然有重复值,所以我遇到了填充列和行值的问题。示例 csv 最终将是:

0          326869253  1386884701  7587032  11609972 49053573 18869940
326869253          0           1        1         1        0        0
1386884701         0           0        0         0        0        0
7587032            0           0        0         0        0        0
11609972           0           0        0         0        0        0
49053573           0           0        1         0        0        0
18869940           0           0        1         0        0        0

我最初通过获取所有值的列表并将其转换为集合(以消除重复值)来构建初始列和行,然后将其转换回列表并将其初始化为数据框,但我想在程序从 txt 文件中读取新信息时构建数据框。谢谢

标签: pythonpandasdataframeadjacency-matrix

解决方案


推荐阅读