Graph图总结

Posted will-zyq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Graph图总结相关的知识,希望对你有一定的参考价值。

  将COMP20003中关于Graph的内容进行总结,内容来自COMP20003,中文术语并不准确,以英文为准。


 

Graph G = {V, E}

  顶Vertices V: can contain information

  边Edges E (links between vertices): can have direction and/or weight   

种类:

  •   有向图(directed graph):边(edge)有方向。
    • 弱有向连接图Weakly connected directed graph:将有向的边替换成无向的边后能得到无向连通图。

    技术分享图片

    • 强有向连接图Strongly connected directed graph:在有向图中,任意顶通过边到达任意顶。

    技术分享图片

      • Strongly connected components in a directed graph:在同一区域(component)的顶可以到达所有同一区域的顶。

        技术分享图片

 

    

  •   无向图(undirected graph):边(edge)没有方向。
    • 无向连通图Connected Undirected graph: 任意的顶均可通过边连接到其他顶,包括间接。

    技术分享图片

    •  无向非连通图Unconnected Undirected graph:即不是无向连通图Connected Undirected graph。

    技术分享图片

 完全图Complete graph:每个直接到其他顶。对于无向图至少需要V(V-1)/2个顶,有向图至少需要V(V - 1)个顶。


用数据结构表示:

二维数组(Matrix)表示:

技术分享图片

注意:未连接用无穷大表示,而不是用0表示。

复杂度O(V2)

链表表示:

技术分享图片

 

 复杂度O(V + E) 


 图的遍历Traversal 

Depth-first search(DFS)深度优先搜索,使用stack实现,基于stack先进后出的特性。

Breadth first search(BFS)广度优先搜索,使用queue实现,基于queue先进先出的特性。


算法:

Dijkstra‘s algorithm for single source shortest path

Dijkstra单源最短路径算法:一个顶到其他顶的最短路径。

基于Greedy algorithm: 最短路径中的子路径也是最短路径,即A到Y的最短路径经过X,那么该路径中从A到X的部分是A到X的最短路径。

假定没有负值的边。

使用优先队列priority queue

步骤:

  使用变量数组dist记录从目标定到该顶的最短距离,数组pred记录经过该顶的前一个顶,edgeWeight(a, b):顶a到顶b边的值。

    1. 将dist自己到自己为0,其余最大(MAX_INT)。pred均为NULL。
    2. 将所有顶装入优先队列,按照对应的dist值的大小为优先度。
    3. 当优先队列不为空时,pop一个顶a,为空则结束。
    4. LOOP:如果dist[a] + edgeWeight(a, b) < dist[b],b为跟顶a有边连接的顶,则更新顶b的信息:dist[b] = dist[a] + edgeWeight(a, b),pred[b] = a,更新优先队列中的顺序(也可pop时再根据有限度pop)。
    5. 步骤3。

    复杂度分析:

    技术分享图片

 

    实现代码:https://github.com/Will-Zhu-27/Algorithms-and-Data-Structures/tree/master/graph/shortestPaths/dijkstra

 

Warshall algorithm for transitive closure -- unconnected directed graph

Warshall算法:用于判断有向图中顶与顶之间是否能通过边联通(包括间接的)。

  用二维数组储存基础(直接)边连接的信息,使用三次循环。

  技术分享图片

    其中i for intermediate, s for source, t for to,循环变量怎么命名的并不重要,重要的是最外圈的循环变量i必须作为判断的中间变量,改变它的位置会导致算法出错。我的理解为:算法是基于贪心算法,

    当循环到 i 时,就要得到通过 0 到 i 是否有最短路径,然后逐渐增大i达到在全部顶中的最短路径。此问题也可看在知乎上的这个问题的回答:https://www.zhihu.com/question/30955032

 

Floyd-Warshall algorithm for all pairs shortest paths

Floyd-Warshall算法:图中每个顶到其他顶的最短路径。

  在Warshall的基础上稍作改变,二维数组储存的是顶之间weight的信息。

   技术分享图片

同样的,最外圈的循环变量i必须作为判断的中间变量!另外用C实现时,虽然图里不连接用了∞表示, C中用 INT_MAX / 2 表示, 因为if 判断时会产生数据溢出问题。

要记录路径也只要加个二维数组记录即可。

复杂度:θ(V3)

代码:https://github.com/Will-Zhu-27/Algorithms-and-Data-Structures/tree/master/graph/AllPairsShorestPaths/Floyd-Warshall

 

Floyd-Warshall和dijkstra在计算all pairs shorest paths上的优劣:

  循环V次dijkstra也可得到全部顶的最短路径,复杂度为:O((V2 + V * E)logV)

  Floyd-Warshall复杂度为θ(V3)

  对于sparse graph with positive edge weights(V>>E),Dijkstra用于all pair shortest path更好

    对于dense graph with positive edge weights(E>>V) Floyd-Warshall更好

 

  

 

以上是关于Graph图总结的主要内容,如果未能解决你的问题,请参考以下文章

图论(graph)相关算法总结

Graph Representation Learning阶段总结Chapter1~6

Graph Representation Learning阶段总结Chapter1~6

Nebula Graph + Plato调研总结

Nebula Graph + Plato调研总结

Nebula Graph + Plato调研总结