python - 错误的networkx Graph和可视化很难看
问题描述
我的数据框由 60 多个 (2x2) 大小的值组成,一些数据的样本如下
label data_pairs
-1040 [(-1037.13, -1044.77)]
-1092 [(-1102.64, -1081.64)]
-1105 [(-1107.36, -1102.64)]
-137 [(-136.19, -138.75)]
-1431 [(-1434.08, -1429.31)]
-612 [(-622.47, -601.98)]
-672 [(-669.77, -674.95)]
-752 [(-748.22, -755.9)]
-791 [(-795.19, -788.02)]
正如数据集中的名称所暗示的那样,我想相应地为它们绘制networkx
图形。根据 StackOverflow 用户的建议之一,我按照他的指导进一步修改了代码如下pair's values
label
df=pd.read_excel (r'C:\Users\xxx\Documents\Python Scripts\Python
Scripts\uuu\data_pairs.xlsx') # type: datFrame (10,2)
代码networkx
如下
import networkx as nx
G = nx.DiGraph()
edges = np.stack(df.Pairs.to_numpy()).reshape(-1,2) # array of str1248 (5,2)
G = nx.from_edgelist(edges)
pos = nx.spring_layout(G, k=0.6) # dict
fig=plt.figure(figsize=(10,2),dpi=300)
nx.draw(G, pos=pos, node_size=800, with_labels=True,node_color='y')
edges
值看起来像这样
[(-1037.13, -1044.77)] [(-1102.64, -1081.64)]
[(-1107.36, -1102.64)] [(-1187.16, -1192.42)]
[(-1261.33, -1280.02)] [(-136.19, -131.06)]
[(-131.06, -138.75)] [(-136.19, -138.75)]
[(-1434.08, -1429.31)] [(-304.94, -308.8), (-304.94, -307.85)]
正如您所看到的,这些数字看起来是错误的,因为edges
它们使用两个值来连接图形。此外,图中没有显示标签。例如对于data_pairs
值 [(-1037.13, -1044.77)] 我应该label
在行之间得到值 -1040。像这样的东西(-1037.13)--------------------> (-1044.77)
,同样的。
-1040
以上只是为了理解。
你能帮我如何得到这样的结果吗?非常感谢提前
解决方案
问题是您的列包含嵌套在列表中的元组。您需要正确构造值,以便networkX
按预期构建 rgaph。一种简单的方法是将值堆叠到一个数组中,并适当地重塑。
此外,nx.spring_layout
还有一个参数k
,用于设置图中节点之间的间距:
from ast import literal_eval
from itertools import chain
df['data_pairs']= df['data_pairs'].map(literal_eval)
G = nx.from_edgelist(chain.from_iterable(df.data_pairs))
plt.figure(figsize=(10,5))
pos = nx.spring_layout(G, k=.6)
nx.draw(G,
pos=pos,
node_size=800,
with_labels=True,
node_color='y')
输入数据 -
G.edges()
EdgeView([(-1037.13, -1044.77), (-1102.64, -1081.64), (-1102.64, -1107.36),
(-136.19, -138.75), (-1434.08, -1429.31), (-622.47, -601.98),
(-669.77, -674.95), (-748.22, -755.9), (-795.19, -788.02),
(-304.94, -308.8), (-304.94, -307.85)])
推荐阅读
- java - JerseyApplication bindFactory 排名属性未在测试中考虑
- excel - 在 CSV 文件中过滤具有唯一模式的特定数据,并将该数据移动到同一行的新列
- javascript - 非对象值的请求键
- symfony - Gaufrette 列表 ftp 文件
- java - 接口注解不接受 application.properties 值
- typescript - TypeScript - 限制冗长代码块的数据结构和组织
- python - TFTPy 导入,没有名为 tftpy 的模块
- c# - 更改按钮外观/图标
- javascript - 在 React 中将函数传递给子进程
- scala - 高级类型和无标签决赛