数据结构----并查集

Posted 4nc414g0n

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据结构----并查集相关的知识,希望对你有一定的参考价值。

并查集

并查集概念

并查集

  • 在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)

例如有10个元素:
用vector存储:

他们的关系用树形结构表示如下:

在vector中表示如下:

可见:

  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

即相当于将子节点的-1值加到父节点的值上


若将8和4合并到一个集合,就是将他们的根节点合并,即:

其vector就变为:

并查集的模拟实现

模拟实现

并查集一般实现:

  1. 查找元素属于哪个集合:沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
  2. 查看两个元素是否属于同一个集合:沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合:将两个集合中的元素合并,将一个集合名称改成另一个集合的名称
  4. 集合的个数:遍历数组,数组中元素为负数的个数即为集合的个数

模拟实现:
较简单(略)

  • 注意:两集合合并没有规定必须哪个做根(一般将高度较小的树并入高度较大的树,这样使最终的高度变小,提高平均查找效率)
class UnionFindSet

public:
	UnionFindSet(int size)
		: _set(size, -1)
	
	size_t FindRoot(int x)//判断是否在一个集合,直接复用FindRoot即可
	//此处的x为给定的下标
		while (_set[x] >= 0)
		
			x = _set[x];
		
		return x;//注意返回下标,如无根就返回本身(不是返回_set[x])
	
	bool IsInSet(int x1, int x2)
	
		return (FindRoot(x1) == FindRoot(x2));
	
	void Union(int x1, int x2)
	
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);
		//这里可以加一层判断,将高度较小的树并入高度较大的树
		if (root1 != root2)
		
			_set[root1] += _set[root2];
			_set[root2] = root1;
		
	
	size_t SetCount()
	
		size_t n = 0;
		for (auto e : _set)
			if (e < 0)
				n++;
		return n;
	
private:
	vector<int> _set;
;

测试:

并查集优化

Union优化

把元素少的集合根节点指向元素多的根节点,能更高概率的生成一个层数比较低的树
较简单,见:并查集 size 的优化


在这里利用元素多的根节点,_set[root]的负值越大,abs()转换为正数进行比较

void Union(int x1, int x2)

	int root1 = FindRoot(x1);//4->1
	int root2 = FindRoot(x2);//8->0
	if (root1 != root2)
	
		if (abs(_set[root1])<abs(_set[root2]))
			swap(root1, root2);
		_set[root1] += _set[root2];
		_set[root2] = root1;
	

压缩路径

在Find的过程中递归进行路径压缩,找到根就返回,置为根的子节点,路径压缩为1
一般考虑在过程中顺带进行压缩,不一定要一次压缩完成高度为1
如果高度较短不需要压缩

循环

写法1:

size_t FindRoot(int x)//判断是否在一个集合,直接复用FindRoot即可
	//此处的x为给定的下标
		while (_set[x] >= 0)//不为根节点
		
			if(_set[_set[x]]>=0)
				_set[x] = _set[_set[x]];
			x = _set[x];
		
		return x;
	


写法二:

int FindRoot(int x)

	int root = x;
	while (_set[root] >= 0)
	
		root = _set[root];
	
	// 路径压缩
	while (_set[x] >= 0)
	
		int parent = _set[x];
		_set[x] = root;
		x = parent;
	
	return root;

递归 (深度过深有栈溢出的风险)

size_t FindRoot(int x)//判断是否在一个集合,直接复用FindRoot即可
//此处的x为给定的下标
	if (_set[x] >= 0)//不为根节点
	
		_set[x] = FindRoot(_set[x]);//在Find的过程中进行路径压缩,找到根就返回,置为根的子节点,路径压缩为1		
		return _set[x];
	
	else//为根节点
		return x;//注意返回下标(不是返回_set[x])

并查集例题

剑指 Offer II 116. 省份数量
注意:不需要重写一个并查集,直接使用并查集思想

class Solution 
public:
   int findCircleNum(vector<vector<int>>& isConnected) 
       //不需要重写一个并查集,直接使用并查集思想
       vector<int> ufs(isConnected.size(), -1);
       auto find = [&ufs](int x)
       
           while(ufs[x]>=0)
           
               x=ufs[x];
           
           return x;
       ;
       for(int i=0;i<isConnected.size();i++)
       
           for(int j=0;j<isConnected[0].size();j++)
           
               if(isConnected[i][j] == 1)
               
                   int root1=find(i);
                   int root2=find(j);
                   if(root1!=root2)
                   
                       ufs[root1]+=ufs[root2];
                       ufs[root2]=root1;
                   
               
           
       
       int ret=0;
       for(auto &e:ufs)
       
           if(e<0)
               ret++;
       
       return ret;
   
;

等式方程的可满足性
并查集思想:按照==的表达式构建并查集,再用!=的表达式判断,相悖即false

class Solution 
public:
   bool equationsPossible(vector<string>& equations) 
       vector<int> ufs(26, -1);// 是26个小写字母
       auto find = [&ufs](int x)
       
           while(ufs[x]>=0)
           
               x=ufs[x];
           
           return x;
       ;
       for(auto &str: equations)
       
           if(str[1]=='=')//按照输入建立并查集(==表示集合关系)
           
               int root1 = find(str[0]-'a');
               int root2 = find(str[3]-'a');
               if(root1!=root2)//注意这里是!=
               
                   ufs[root1]+=ufs[root2];
                   ufs[root2]=root1;
               
           
       
       for(auto &str: equations)
       
           if(str[1]=='!')//与输入相悖返回false 
           
               int root1 = find(str[0]-'a');
               int root2 = find(str[3]-'a');
               if(root1==root2)
               
                   return false;
               
           
       
       return true;
   
;

以上是关于数据结构----并查集的主要内容,如果未能解决你的问题,请参考以下文章

并查集

数据结构--并查集

数据结构--并查集

数据结构----并查集

数据结构----并查集

数据结构 并查集