首页 > 解决方案 > Kosaraju 的 scc 算法

问题描述

谁能解释一下 Kosaraju 寻找连通分量的算法背后的逻辑?

我已经阅读了描述,但我无法理解反向图上的 DFS 如何检测强连接组件的数量。

def dfs(visited, stack, adj, x):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            dfs(visited, stack, adj, neighbor)

    stack.insert(0, x)
    return stack, visited

def reverse_dfs(visited, adj, x, cc):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            cc += 1
            reverse_dfs(visited, adj, neighbor,cc)
    print(x)
    return cc


def reverse_graph(adj):
    vertex_num = len(adj)
    new_adj = [ [] for _ in range(vertex_num)]
    for i in range(vertex_num):
        for j in adj[i]:
            new_adj[j].append(i)
    return new_adj


def find_post_order(adj):
    vertex_num = len(adj)
    visited = [0] * vertex_num
    stack = []

    for vertex in range(vertex_num):
        if visited[vertex] == 0:
            stack, visited = dfs(visited, stack, adj, vertex)

    return stack


def number_of_strongly_connected_components(adj):
    vertex_num = len(adj)
    new_adj = reverse_graph(adj)
    stack = find_post_order(adj)

    visited = [0] * vertex_num
    cc_num = 0
    while (stack):
        vertex = stack.pop(0)
        print(vertex)
        print('------')
        if visited[vertex] == 0:
            cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
    return cc_num

if __name__ == '__main__':
    input = sys.stdin.read()
    data = list(map(int, input.split()))
    n, m = data[0:2]
    data = data[2:]
    edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
    adj = [[] for _ in range(n)]
    for (a, b) in edges:
        adj[a - 1].append(b - 1)
    print(number_of_strongly_connected_components(adj))

在上面你可以找到我的实现。我猜初始 DFS 和反向操作都正确完成了,但我不知道如何正确执行第二个 DFS。提前致谢。

标签: pythonalgorithmgraphkosaraju-algorithm

解决方案


您应该注意到的第一件事是强连通分量的集合对于图及其反转是相同的。实际上,该算法实际上是在反转图中找到强连通分量的集合,而不是原来的(但没关系,因为两个图具有相同的 SCC)。

第一次 DFS 执行会产生一个堆栈,该堆栈以特定顺序保存顶点,这样当第二个 DFS 按此顺序(在反转图上)在顶点上执行时,它会正确计算 SCC。因此,运行第一个 DFS 的全部目的是找到图顶点的排序,以服务于在反向图上执行 DFS 算法。现在我将解释堆栈中顶点的顺序具有什么属性,以及它如何服务于反向图上的 DFS 执行。

那么栈的属性是什么?想象一下 S1 和 S2 是图中的两个强连通分量,而在反向图中,S2 可以从 S1 到达。显然,S1 也不能从 S2 到达,因为如果是这样的话,S1 和 S2 将折叠成一个单独的组件。令 x 为 S1 中的顶点中的顶部顶点(即,S1 中的所有其他顶点在堆栈中低于 x)。类似地,设 y 为 S2 中的顶点中的顶部顶点(同样,S2 中的所有其他顶点在堆栈中低于 y)。属性是y(属于S2)在堆栈中高于x(属于S1)。

为什么这个属性有帮助?当我们在逆向图上执行 DFS 时,我们是按照栈顺序来做的。特别是,我们在探索 x 之前探索 y。在探索 y 时,我们探索 S2 的每个顶点,并且由于从 S2 无法到达 S1 的任何顶点,我们在探索 S1 的任何顶点之前探索 S2 的所有顶点。但这适用于任何一对连接的组件,这样一个组件可以从另一个组件访问。特别是,堆栈顶部的顶点属于一个接收器组件,在我们完成对接收器组件的探索之后,顶部顶点再次属于相对于由尚未探索的顶点诱导的图的接收器。

因此,该算法正确地计算了反转图的所有强连通分量,如前所述,它们与原始图中的相同。


推荐阅读