如何使用非递归方法实现深度优先搜索图

Posted

技术标签:

【中文标题】如何使用非递归方法实现深度优先搜索图【英文标题】:How to implement depth first search for graph with a non-recursive approach 【发布时间】:2014-02-02 08:58:36 【问题描述】:

我在这个问题上花了很多时间。但是,我只能找到对树使用非递归方法的解决方案:Non recursive for tree,或者为图形找到递归方法,Recursive for graph。

而且很多教程(我在这里不提供这些链接)也没有提供方法。或者教程完全不正确。请帮帮我。

更新:

真的很难形容:

如果我有一个无向图:

   1
 / |  \
4  |   2
    3 /

1-- 2-- 3 --1是一个循环。

在步骤:'将弹出的顶点的邻居推入堆栈'时,顶点应该被推入的顺序是什么?

如果推送顺序为243,则栈中的顶点为:

| |
|3|
|4|
|2|    
 _

弹出节点后,我们得到结果:1 -> 3 -> 4 -> 2 而不是1--> 3 --> 2 -->4

这是不正确的。我应该添加什么条件来停止这种情况?

【问题讨论】:

使用@amit 的优秀答案中的算法,我无法让 4 出现在 3 和 2 之间。算法中有一个重要的细节。仅在实际访问节点时才将节点添加到访问集中,而不是在将其压入堆栈时。在堆栈推送上将其标记为已访问会导致您遇到的问题,因为它会阻止将 3 视为 2 的子项,或将 2 视为 3 的子项。 【参考方案1】:

没有递归的 DFS 与 BFS 基本相同 - 但使用 stack 而不是队列作为数据结构。

线程Iterative DFS vs Recursive DFS and different elements order 处理这两种方法以及它们之间的区别(还有!你不会以相同的顺序遍历节点!)

迭代方法的算法基本上是:

DFS(source):
  s <- new stack
  visited <-  // empty set
  s.push(source)
  while (s is not empty):
    current <- s.pop()
    if (current is in visited):
        continue
    visited.add(current)
    // do something with current
    for each node v such that (current,v) is an edge:
        s.push(v)

【讨论】:

嗯,那个线程并没有告诉我具体的函数实现比如:stack.Read();无论如何,我想知道how to avoid cyclic problem,避免在添加一个节点的邻居时重复添加相同的节点AND,推入堆栈的节点的顺序是正确的,因此当我将它们弹出时,它可以得到正确的顺序。 @Stallman visited 跟踪访问过的节点,这样您就不会两次访问同一个节点。至于迭代的顺序,如果您有特定的顺序,您可以通过将for each node... 行替换为您的迭代顺序来实现它。 +1 以获得好的答案! 我必须实现一个可执行代码来确保你的伪代码是正确的。或者您可以提供具体的source code 来证明。 这段代码的空间复杂度不会占用额外的内存吗?我相信迭代 DFS 的最佳空间复杂度是 O(n)。 此代码的空间和时间为 O(n²)。考虑一个complete graph(每个顶点都连接到其他每个顶点)。对于所有 n 个顶点,while 循环的每次迭代都会将另一个 n 个顶点列表添加到堆栈中,因此总共会有 O(n²) 次迭代。由于访问顶点的弹出,空间增长有点慢,但它仍然是 O(n²),因为它随着算术级数 n+(n-1)+(n-2)+...+2+1 增长。试试this example code。【参考方案2】:

这不是一个答案,而是一个扩展评论,展示了算法在@amit 对当前版本问题中的图的回答中的应用,假设 1 是起始节点,其邻居按 2 顺序推送, 4, 3:

               1
             / |  \
            4  |   2
               3 /

Actions            Stack             Visited
=======            =====             =======
push 1             [1]               
pop and visit 1    []                1
 push 2, 4, 3      [2, 4, 3]         1
pop and visit 3    [2, 4]            1, 3
 push 1, 2         [2, 4, 1, 2]      1, 3
pop and visit 2    [2, 4, 1]         1, 3, 2
 push 1, 3         [2, 4, 1, 1, 3]   1, 3, 2
pop 3 (visited)    [2, 4, 1, 1]      1, 3, 2
pop 1 (visited)    [2, 4, 1]         1, 3, 2
pop 1 (visited)    [2, 4]            1, 3, 2
pop and visit 4    [2]               1, 3, 2, 4
  push 1           [2, 1]            1, 3, 2, 4
pop 1 (visited)    [2]               1, 3, 2, 4
pop 2 (visited)    []                1, 3, 2, 4

因此应用以 2、4、3 顺序推送 1 的邻居的算法导致访问顺序为 1、3、2、4。无论 1 的邻居的推送顺序如何,2 和 3 在访问顺序中将是相邻的,因为先访问过的会推送尚未访问过的另一个,以及已访问过的 1。

【讨论】:

很好的解释。由于没有提供源代码,我无法将此标记为答案。 为什么要推送访问过的节点? @Shiro 一个节点可能在堆栈中被访问,因此在弹出期间检查访问是不可避免的。请参见示例中的非 2。您也可以在推送期间进行检查,但没有必要这样做。 @Shiro 你会如何改变算法? @Shiro 这样做的代价是额外的条件分支。通过导致管道刷新,条件分支可能非常昂贵。很明显,一个简单的堆栈 push-pop 所节省的成本将涵盖分支的成本,并且添加它会使算法变得比它需要的更复杂。【参考方案3】:

DFS 逻辑应该是:

1)如果当前节点未被访问,则访问该节点并将其标记为已访问 2) 对于所有未访问过的邻居,将它们推送到堆栈中

例如,让我们在 Java 中定义一个 GraphNode 类:

class GraphNode 
    int index;
    ArrayList<GraphNode> neighbors;

这是没有递归的 DFS:

void dfs(GraphNode node) 
    // sanity check
    if (node == null) 
        return;
    

    // use a hash set to mark visited nodes
    Set<GraphNode> set = new HashSet<GraphNode>();

    // use a stack to help depth-first traversal
    Stack<GraphNode> stack = new Stack<GraphNode>();
    stack.push(node);

    while (!stack.isEmpty()) 
        GraphNode curr = stack.pop();

        // current node has not been visited yet
        if (!set.contains(curr)) 
            // visit the node
            // ...

            // mark it as visited
            set.add(curr);
        

        for (int i = 0; i < curr.neighbors.size(); i++) 
            GraphNode neighbor = curr.neighbors.get(i);

            // this neighbor has not been visited yet
            if (!set.contains(neighbor)) 
                stack.push(neighbor);
            
        
    

我们可以使用相同的逻辑递归地做 DFS,克隆图等。

【讨论】:

【参考方案4】:

很多人会说非递归 DFS 只是 BFS 有一个堆栈而不是一个队列。这不准确,让我再解释一下。

递归 DFS

递归 DFS 使用调用堆栈来保持状态,这意味着您无需自己管理单独的堆栈。

但是,对于大型图,递归 DFS(或任何递归函数)可能会导致深度递归,这可能会导致您的问题因堆栈溢出而崩溃(不是本网站,the real thing)。

非递归 DFS

DFS 与 BFS 不同。它有不同的空间利用率,但如果你像 BFS 一样实现它,但使用堆栈而不是队列,你将使用比非递归 DFS 更多的空间。

为什么要更多空间?

考虑一下:

// From non-recursive "DFS"
for (auto i&: adjacent) 
    if (!visited(i)) 
        stack.push(i);
    

并将其与此进行比较:

// From recursive DFS
for (auto i&: adjacent) 
    if (!visited(i)) 
        dfs(i);
    

在第一段代码中,您将所有相邻节点放入堆栈中,然后再迭代到下一个相邻顶点,这需要空间成本。如果图表很大,它可能会产生显着差异。

那该怎么办?

如果您决定在弹出堆栈后通过再次迭代邻接列表来解决空间问题,那将增加时间复杂度成本。

一种解决方案是在您访问项目时将项目一项一项添加到堆栈中。为此,您可以在堆栈中保存一个迭代器,以便在弹出后恢复迭代。

懒惰的方式

在 C/C++ 中,一种懒惰的方法是编译具有更大堆栈大小的程序并通过ulimit 增加堆栈大小,但这真的很糟糕。在 Java 中,您可以将堆栈大小设置为 JVM 参数。

【讨论】:

【参考方案5】:

递归是一种使用调用栈来存储图遍历状态的方法。您可以显式使用堆栈,例如通过使用类型为 std::stack 的局部变量,那么您将不需要递归来实现 DFS,而只需一个循环。

【讨论】:

是的,我尝试使用堆栈,但我不知道如何避免循环问题。【参考方案6】:

好的。如果你还在寻找java代码

dfs(Vertex start)
    Stack<Vertex> stack = new Stack<>(); // initialize a stack
    List<Vertex> visited = new ArrayList<>();//maintains order of visited nodes
    stack.push(start); // push the start
    while(!stack.isEmpty()) //check if stack is empty
        Vertex popped = stack.pop(); // pop the top of the stack
        if(!visited.contains(popped)) //backtrack if the vertex is already visited
            visited.add(popped); //mark it as visited as it is not yet visited
            for(Vertex adjacent: popped.getAdjacents()) //get the adjacents of the vertex as add them to the stack
                    stack.add(adjacent);
            
        
    

    for(Vertex v1 : visited)
        System.out.println(v1.getId());
    

【讨论】:

你应该稍微解释一下代码... OP应该了解代码是如何工作的... 提供纯代码就像做他们的家庭作业... 嗯,我明白了。有道理。【参考方案7】:

Python 代码。时间复杂度为O(V+E),其中VE分别是分别为顶点数和边数。空间复杂度为 O(V),因为最坏的情况是有一条路径包含每个顶点而没有任何回溯(即搜索路径是 linear chain)。

堆栈存储形式为 (vertex, vertex_edge_index) 的元组,以便 DFS 可以从紧跟从该顶点处理的最后一条边的特定顶点处恢复(就像递归的函数调用堆栈DFS)。

示例代码使用complete digraph,其中每个顶点都连接到其他每个顶点。因此没有必要为每个节点存储一个显式的边列表,因为图是一个边列表(图 G 包含每个顶点)。

numv = 1000
print('vertices =', numv)
G = [Vertex(i) for i in range(numv)]

def dfs(source):
  s = []
  visited = set()
  s.append((source,None))
  time = 1
  space = 0
  while s:
    time += 1
    current, index = s.pop()
    if index is None:
      visited.add(current)
      index = 0
    # vertex has all edges possible: G is a complete graph
    while index < len(G) and G[index] in visited:
      index += 1
    if index < len(G):
      s.append((current,index+1))
      s.append((G[index], None))
    space = max(space, len(s))
  print('time =', time, '\nspace =', space)

dfs(G[0])

输出:

time = 2000 
space = 1000

注意这里的时间是测量V操作而不是E。该值是 numv*2,因为每个顶点都被考虑两次,一次是在发现时,一次是在完成时。

【讨论】:

我来到***是为了避免堆栈溢出。【参考方案8】:

实际上,stack 并不能很好地处理发现时间和完成时间,如果我们想用 stack 实现 DFS,并且想要处理发现时间和完成时间,我们需要求助于另一个记录器堆栈,我的实现如下图,测试正确,下图为case-1、case-2和case-3。

from collections import defaultdict

class Graph(object):

    adj_list = defaultdict(list)

    def __init__(self, V):
        self.V = V

    def add_edge(self,u,v):
        self.adj_list[u].append(v)

    def DFS(self):
        visited = []
        instack = []
        disc = []
        fini = []
        for t in range(self.V):
            visited.append(0)
            disc.append(0)
            fini.append(0)
            instack.append(0)

        time = 0
        for u_ in range(self.V):
            if (visited[u_] != 1):
                stack = []
                stack_recorder = []
                stack.append(u_)
                while stack:
                    u = stack.pop()
                    visited[u] = 1
                    time+=1
                    disc[u] = time
                    print(u)
                    stack_recorder.append(u)
                    flag = 0
                    for v in self.adj_list[u]:
                        if (visited[v] != 1):
                            flag = 1
                            if instack[v]==0:
                                stack.append(v)
                            instack[v]= 1



                    if flag == 0:
                        time+=1
                        temp = stack_recorder.pop()
                        fini[temp] = time
                while stack_recorder:
                    temp = stack_recorder.pop()
                    time+=1
                    fini[temp] = time
        print(disc)
        print(fini)

if __name__ == '__main__':

    V = 6
    G = Graph(V)

#==============================================================================
# #for case 1
#     G.add_edge(0,1)
#     G.add_edge(0,2)
#     G.add_edge(1,3)
#     G.add_edge(2,1)
#     G.add_edge(3,2) 
#==============================================================================

#==============================================================================
# #for case 2
#     G.add_edge(0,1)
#     G.add_edge(0,2)
#     G.add_edge(1,3)
#     G.add_edge(3,2)  
#==============================================================================

#for case 3
    G.add_edge(0,3)    
    G.add_edge(0,1)

    G.add_edge(1,4)
    G.add_edge(2,4)
    G.add_edge(2,5)
    G.add_edge(3,1)
    G.add_edge(4,3)
    G.add_edge(5,5)    


    G.DFS()   

【讨论】:

【参考方案9】:

我认为您需要使用visited[n] 布尔数组来检查当前节点是否被更早地访问过。

【讨论】:

【参考方案10】:

递归算法非常适合 DFS,因为我们尝试尽可能深入,即。一旦我们找到一个未探索的顶点,我们将立即探索它的第一个未探索的邻居。找到第一个未探索的邻居后,您需要立即跳出 for 循环。

for each neighbor w of v
   if w is not explored
       mark w as explored
       push w onto the stack
       BREAK out of the for loop

【讨论】:

当我们到达一条路径的尽头直到最后一个深度时,如果我们不真的一次将所有邻居都保存在堆栈中,堆栈会不会是空的?【参考方案11】:

我认为这是一个关于空间的优化 DFS-如果我错了,请纠正我。

s = stack
s.push(initial node)
add initial node to visited
while s is not empty:
    v = s.peek()
    if for all E(v,u) there is one unvisited u:
        mark u as visited
        s.push(u)
    else 
        s.pop

【讨论】:

【参考方案12】:

在递归过程中使用堆栈并按照调用堆栈的方式实现-

想法是将一个顶点压入堆栈,然后将其相邻的顶点压入存储在该顶点索引处的邻接列表中,然后继续此过程,直到我们无法在图中进一步移动,现在如果我们无法在图中继续前进,那么我们将删除当前位于堆栈顶部的顶点,因为它无法将我们带到任何未访问的顶点。

现在,我们使用堆栈来处理这一点,即只有当所有可以从当前顶点探索的顶点都已被访问时,该顶点才会从堆栈中移除,这是由递归过程自动完成的。

前 -

See the example graph here.

(0 (1 (2 (4 4) 2) (3 3) 1) 0) (6 (5 5) (7 7) 6)

上面的括号显示了顶点被添加到堆栈和从堆栈中删除的顺序,因此只有当所有可以访问的顶点都完成时,顶点的括号才会关闭。

(这里我使用了邻接表表示,并通过使用 C++ STL 实现为列表的向量(向量 > AdjList))

void DFSUsingStack() 
    /// we keep a check of the vertices visited, the vector is set to false for all vertices initially.
    vector<bool> visited(AdjList.size(), false);

    stack<int> st;

    for(int i=0 ; i<AdjList.size() ; i++)
        if(visited[i] == true)
            continue;
        
        st.push(i);
        cout << i << '\n';
        visited[i] = true;
        while(!st.empty())
            int curr = st.top();
            for(list<int> :: iterator it = AdjList[curr].begin() ; it != AdjList[curr].end() ; it++)
                if(visited[*it] == false)
                    st.push(*it);
                    cout << (*it) << '\n';
                    visited[*it] = true;
                    break;
                
            
            /// We can move ahead from current only if a new vertex has been added on the top of the stack.
            if(st.top() != curr)
                continue;
            
            st.pop();
        
    

【讨论】:

【参考方案13】:

下面的 Java 代码会很方便:-

private void DFS(int v,boolean[] visited)
    visited[v]=true;
    Stack<Integer> S = new Stack<Integer>();
    S.push(v);
    while(!S.isEmpty())
        int v1=S.pop();     
        System.out.println(adjLists.get(v1).name);
        for(Neighbor nbr=adjLists.get(v1).adjList; nbr != null; nbr=nbr.next)
             if (!visited[nbr.VertexNum])
                 visited[nbr.VertexNum]=true;
                 S.push(nbr.VertexNum);
             
        
    

public void dfs() 
    boolean[] visited = new boolean[adjLists.size()];
    for (int v=0; v < visited.length; v++) 
        if (!visited[v])/*This condition is for Unconnected Vertices*/ 

            System.out.println("\nSTARTING AT " + adjLists.get(v).name);
            DFS(v, visited);
        
    

【讨论】:

以上是关于如何使用非递归方法实现深度优先搜索图的主要内容,如果未能解决你的问题,请参考以下文章

深度优先搜索和广度优先搜索的比较与分(转)

数据结构与算法图遍历算法 ( 深度优先搜索 DFS | 深度优先搜索和广度优先搜索 | 深度优先搜索基本思想 | 深度优先搜索算法步骤 | 深度优先搜索理论示例 )

深度优先(DFS)与广度优先搜索(BFS)递归版与非递归版

深度优先搜索

基于邻接表的深度优先遍历 (非递归)

层次遍历递归和非递归方法