《画解数据结构》（3 - 4）- 最小生成树

Posted 2022-04-28 英雄哪里出来

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《画解数据结构》（3 - 4）- 最小生成树相关的知识，希望对你有一定的参考价值。

本文已收录于专栏 🌳《画解数据结构》🌳

文章目录

前言

好久没有写图论相关的文章了，趁着今天月黑风高，夜深人静，今天介绍一个利用贪心思想求解的算法，即图论中非常重要的概念，它就是：

「最小生成树」

一、概念

1、生成树

一个连通图，它的 极小连通子图 就是生成树。它含有图中所有的 $n$ 个结点，并且只有能够构成树的 $n - 1$ 条边。如图所示的红色边就是其中一个生成树。

2、最小生成树

当图上的边有权值时，我们把构造这个 极小连通子图 的最小总代价生成树称为 最小生成树。如下图所示的红色线段组成的生成树就是最小生成树。

二、算法

找最小生成树的常用算法主要有三种：Prim、Kruscal、Boruvka。

1、Prim

1）算法描述

Prim 算法是基于贪心的，算法描述如下：
a. 利用邻接矩阵存储dist[i][j]两点 $i$ 和 $j$ 之间的距离；
b. 用cost[i]来表示 最小生成树集合 和 非最小生成树 中的点 $i$ 的最小距离，当cost[i] = 0代表 $i$ 就是 最小生成树 集合中的顶点。
c. 由于是生成树，所以顶点 $0$ 一定在树上，初始化cost[i]就是 $0$ 和 $i$ 的距离（因为 最小生成树集合 目前只有0）。
d. 从cost[i]中寻找一个值不为零（因为值为零表示是最小生成树集合中的点）且最小的顶点u，那么 cost[u]一定是 最小生成树上的边。于是，u也成了 最小生成树上的点。
e. 然后，继续用u去更新cost[i]，即更新 最小生成树集合 和 非最小生成树的点 之间的距离，回到 d 继续迭代计算。

2）源码剖析

int minSpanningTree(int n, int dist[maxn][maxn]) 
    int i, u, ret, dis;
    int cost[maxn];                                
    for(i = 0; i < n; ++i) 
        cost[i] = (i == 0) ? 0 : dist[0][i];       // (1)  
    
    ret = 0;                                       // (2)
    while(1) 
        dis = inf;
        for(i = 0; i < n; ++i)                    // (3)
            if(cost[i] && lessthan(cost[i], dis) ) 
                dis = cost[i];
                u = i;
            
        
        if(dis == inf) 
            return ret;                            // (4)
        
        ret += cost[u];                            // (5)
        cost[u] = 0;                               // (6)
        for(i = 0; i < n; ++i)                    // (7)
            if(cost[i] && lessthan(dist[u][i], cost[i])) 
                cost[i] = dist[u][i];
            
        
    

    return inf;

$(1)$ cost[i]表示 当前最小生成树集合 和 当前非最小生成树 中的点 $i$ 的最小距离，当cost[i] = 0代表 $i$ 就是 当前最小生成树 集合中的顶点；
$(2)$ ret用来存储最小生成树边权之和，初始化为 0；
$(3)$ 从cost[i]中寻找一个值不为零（因为值为零表示是最小生成树集合中的点）且最小的顶点u，那么 cost[u]一定是 最小生成树上的边。于是，u也成了 最小生成树上的点；
$(4)$ 整个查找过程完成，直接返回最小生成树的边权总和；
$(5)$ 将当前边cost[u]加入最小生成树；
$(6)$ 将当前点u加入最小生成树；
$(7)$ 继续用u去更新cost[i]，即更新 最小生成树集合 和 非最小生成树的点 之间的距离；

3）动图详解

4）时间复杂度

当有 $n$ 个结点的时候，每个结点第一次被加入 最小生成树集合 的时候，都要更新其它结点的距离，一共 $n$ 个结点，所以时间复杂度为 $O(n^2)$ 。

2、Kruscal

前置算法：夜深人静写算法（五）- 并查集

1）算法描述

Kruscal 算法也是基于贪心，并且采用 并查集 实现，算法描述如下：
a. 将图中所有的边按照三元组 $(u, v, w)$ 来存储。
b. 然后按照第三关键字 $w$ 将所有边进行递增排序；
c. 顺序取边，并且判断当前边 $(u, v)$ 的两个顶点 $u$ 和 $v$ 是否在同一个集合。如果不在，则这条边就是 最小生成树 上的边，权值累加，合并两个点；如果在，则这条边舍去；
d. 反复迭代取边，直到总共取了 $n - 1$ 条边，则算法结束。

2）源码剖析

#define maxn 1010

int pre[maxn];
void unionfind_init(int n)              // (1)
    for(int i = 0; i < n; ++i) 
        pre[i] = i;
    


int unionfind_find(int x)               // (2)
    return pre[x] == x ? (x) : (pre[x] = unionfind_find(pre[x]));


bool unionfind_union(int x, int y)      // (3)
    int px = unionfind_find(x);
    int py = unionfind_find(y);
    if(px == py) 
        return false;
    
    pre[px] = py;
    return true;



struct KEdge                             // (4)
    int u, v, w;
E[maxn * maxn];

int cmp(const void* a, const void* b)    // (5)
    struct KEdge *pa = (struct KEdge *)a;
    struct KEdge *pb = (struct KEdge *)b;
    return pa->w - pb->w;


// 点的个数 n，边的个数 m
int Kruscal(int n, int m, struct KEdge* edges) 
    int i, ret = 0;
    int edgeCnt = 0;
    qsort(edges, m, sizeof(struct KEdge), cmp);  // (6)
    unionfind_init(n);                           // (7)
    for(i = 0; i < m; ++i) 
        if( unionfind_union( edges[i].u, edges[i].v ) ) 
            ret += edges[i].w;                   // (8)
            if(++edgeCnt == n-1)                // (9)
                return ret;
            
        
    
    return 0;

$(1)$ 并查集的初始化；
$(2)$ 带路径压缩的并查集查找操作；
$(3)$ 并查集的合并操作；
$(4)$ 定义边三元组；
$(5)$ 按照边权从小到大排序的回调函数；
$(6)$ 对所有边进行排序；
$(7)$ 初始化所有结点的并查集信息；
$(8)$ 将当前边加入到最小生成树中；
$(9)$ 如果边数等于 $n - 1$ 则找到解，直接返回；

3）动图详解

4）时间复杂度

由于对边进行了一次排序，所以当边数为 $m$ 时，时间复杂度为 $O(mlog_m)$ 。

3、Boruvka

前置算法：夜深人静写算法（七）- 字典树

1）算法描述

Boruvka 解决的问题较为特殊，求的是异或的最小生成树。具体问题为：给定 $\\le 200000)$ 个点完全图，给定点权值 $a_i(a_i \\le 2^30)$ ，每条边的权值为边的两点的异或值，原题见：codeforces/contest888/G。

这个算法实现采用的是字典树。
a. 将所有数按照递增排序；
b. 将所有排好序的数字，按照顺序，从高位到低位，插入到高度固定的 01-字典树中；
c. 分治求解，对于一棵子树，如果只有左子树，那么最小生成树就一定在左子树上；如果只有右子树，那么最小生成树一定在右子树上；否则就应该是左子树的情况 + 右子树的情况，再加上左子树中选出一个点，右子树中选出一个点，连边，并且取最小值。

2）源码剖析

2.1）数据结构

#include <iostream>
#include <cstring>
#include <string>
#include <algorithm>
#include <cstdlib>
#include <cstdio>

using namespace std;

#define maxn 200010
#define maxb 31
#define maxnodes (maxn*maxb)

#define UNDEF -1 
#define ROOT 0   

struct TrieNode 
    int nodes[2];  // (1)
    int l, r;      // (2)
T[maxnodes];
int TrieNodes;     // (3)

int a[200010]; 

void Init()       // (4)
    memset(T, UNDEF, sizeof(T));
    TrieNodes = 1;


int GetTrieNode() // (5)
    return TrieNodes++;

$(1)$ 字典树结点的两个子结点（0 和 1）；
$(2)$ $[l, r]$ 代表以当前结点为根的子树，管辖的原数组 $a []$ 的区间范围；
$(3)$ TrieNodes本次样例计算中，字典树结点的总个数；
$(4)$ 对字典树结点进行初始化；
$(5)$ 生成一个新的字典树结点；

2.2）插入

首先，把所有的数字先映射到一棵 01 字典树上。如图所示，代表的是一个至多三位的集合组成的字典树。其中集合中的元素可重复，分别为 $001)_2, (011)_2, (011)_2, (100)_2\\$ 。

绿色代表字典树边权；
红色代表集合中的十进制数转换成二进制以后，映射到字典树的情况；
蓝色代表字典树根结点到当前结点的边路径组成的二进制序列；
橙色代表这个数字在集合中出现的次数。

void TrieInsert(int x, int idx)                 // (1)
    int now = ROOT;                              // (2)
    for(int i = maxb-1; i >= 0; --i)            
        int bit = ((x>>i)&数据结构—— 图：最小生成树问题
 [数据结构4.8]平衡二叉树
 树总结（二）平衡二叉树
 Bor?vka 算法求 MST 最小生成树
 数据结构——二叉搜索树(干货满满)
 最小生成树