C++ 不知树系列之认识二叉树(顺序链表存储的实现)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++ 不知树系列之认识二叉树(顺序链表存储的实现)相关的知识,希望对你有一定的参考价值。

1. 概念

什么是二叉树?

顾名思义,二叉树指树中的任何一个结点(除叶结点)的子结点不能多于 2 个。

二叉树可分为:

  • 一般二叉树。只要符合二叉树的定义便可。

  • 满二叉树的意思指除了叶结点,其它结点的子结点都达到了 2 个。

  • 完全二叉树满二叉树也是完全二叉树。完全二叉树可以通俗理解:如果对满二叉树的结点从上向下,从左向右进行有序编号,当删除某个结点后,其编号应该还是相邻有序

二叉树的特性:

二叉树是使用频率非常高的一种树结构。为什么认为二分是最好的,三分、四分……难道就不好吗?

因为二分的理念与计算机底层的二进制存储相吻合,2 的倍数可以给二叉树带来诸多独特的特性:

  • 二叉树的第 i层上最多有 2<sup>i-1</sup> 个结点(i>=1)

证明一:

可以把二叉树看成一个由低位向高位变化的二进制数据。如下图所示的满二叉树时,可以对应一个 3 位的二进制数据。

则第三层(最高位)最大值为2<sup>3-1</sup>=4;第二层(中间位)最大值为2<sup>2-1</sup>=2;第一层(最低位)最大值为2<sup>1-1</sup>=1。

证明二: 更科学的是使用归纳法证明这个命题:

i=0时,显然,二叉树只有一个根结点,命题是成立的。

假设对于第j层,最多结点个数有 2<sup>j-1</sup>是成立,则于 i=j+1层而言,因每一个结点最多只有 2 个子结点,所以,第 i层最多的也只可能有 2*2<sup>j-1</sup>个结点,也就是 2*2<sup>i-2</sup>=2<sup>i-1</sup>。

  • 深度为 k的二叉树最多有 2<sup>k</sup>-1个结点。其实二叉树每一层上的结点个数是一个等比数列:2<sup>0</sup>+2<sup>1</sup>+2<sup>2</sup>+……+2<sup>k-1</sup>,根据等比数列的求和公式可知:s<sub>k</sub>=2<sup>k</sup>-1。

  • 具有 n 个结点的完全二叉树的深度为[log<sub>2</sub>n]+1。

  • 对于一个结点数为 n 且对结点位置进行编号的完全二叉树而言,编号为 i位置的结点和子结点之间满足如下关系:

    i=1时,则为根结点,没有双亲,也可以认为父结点编号为 0;否则,其双亲结点的编号为[i/2]

    2i>n时,则结点i没有左孩子;否则,其左孩子结点的编号为2i

    2i+1>n时,则结点i没有右孩子;否则,其右孩子结点的编号为2i+1

2. 物理存储

二叉树可以采用顺序表或链表两种存储结构。

2.1 顺序存储

因为二叉树是非线性结构,理论上很难用顺序存储描述出数据之间的逻辑关系。但是,于完全二叉树而言,因父子结点之间满足特定的数学关系,使用顺序表存储则较容易实现。

2.1.1 实现思路

  • 创建一个一维数组,把根结点存储在数组中下标为 1的位置。下标为 0的位置存储数字0,表示根结点没有父结点。

  • 如果根结点有左右子结点,根据完全二叉树中父子结点之间的数学规律:左子结点存储在 2*i位置,右子结点存储在2*i+1位置。

  • 利用树的递归定义思想。把已经存储的结点作为根结点,检查是否存在子结点,然后按照父子结点之间的数学关系继续进行存储,直到存储完所有结点。

顺序存储的优点:

  • 数据存储在一维数组中,数组的索引号可以描述数据与数据之间的关系。
  • 数据信息以及数据之间的逻辑关系一步到位。极度舒适的不要不要的!

2.1.1 具体实现

完全二叉树的顺序表存储的具体实现流程。

  • 定义结点类型:用来描述结点本身的信息。
#include <iostream>
#define MAX  10
using namespace std;
template<typename T>
struct BTNode 
	//编号,唯一标识符
	int code;
	//数据
	T data;
	BTNode() 
	BTNode(int code,T val) 
		this->code=code;
		this->data=val;
	
	//自我显示
	void desc() 
		cout<<"结点:"<<this->code<<"_"<<this->data<<endl;
	
;
  • 定义树类型:此类中提供对树的常规操作方法。
template<typename T>
class BinaryTree 
	private:
		//使用一维数组作为树结点存储容器
		BTNode<T>  elem[MAX];
		//二叉树结点的编号由内部指定,根结点编号从 1 开始,这里的编号仅是结点的标识符
		int idx=1;
		//树中结点的数量
		int size=0;
	public:
		//无参构造函数
		BinaryTree() 

		
		//有参构造函数,初始化根结点
		BinaryTree(T val,T init) 
			//初始化数组
			for(int i=0; i<MAX; i++) 
                 //默认值为0,init
				this->elem[i]= 0,init;
			
			//创建根结点
			BTNode<T> root(this->idx++,val);
             //根结点添加在下标为 1 的位置
			this->elem[1]=root;
			this->size++;
		
		//得到根结点
		BTNode<T> getRoot() 
			return this->elem[1];
		
		//查询结点在数组中的存储位置
		int findIndex(BTNode<T> node) 
			for(int i=1; i<=this->size; i++) 
				if(this->elem[i].data==node.data)
					return i;
			
			return -1;
		
		//根据值查询结点
		BTNode<T> findIndex(T val) 
			for(int i=1; i<=this->size; i++) 
				if(this->elem[i].data==val)
					return this->elem[i];
			
			return 0,\\0;
		
		//添加新结点
		BTNode<T> addNewNode(BTNode<T> parent,T val) 
			//得到父结点的存储位置
			int pos= this->findIndex(parent);
             if(pos==-1)
                 return NULL;
			//创建新结点
			BTNode<T> newNode(this->idx++,val);
			if (this->elem[pos*2].code==0) 
				//说明左子结点位置为空
				this->elem[pos*2]=newNode;
				this->size++;
				return newNode;
			 else if(this->elem[pos*2+1].code==0) 
				//说明右子结点位置为空
				this->elem[pos*2+1]=newNode;
				this->size++;
				return newNode;
			 else 
				//说明左右子结点都已经存在,不能插入
				BTNode<T> tmp= 0,\\0;
				return tmp;
			
		
		//得到结点的左子结点
		BTNode<T> getLeftNode(BTNode<T> parent) 
			//结点的存储位置
			int pos= this->findIndex(parent);
             if(2*pos>this->size)
                 return 0,\\0;
             else
                 //说明存在左子结点
				return this->elem[pos*2];
             
		
		//得到结点的右子结点
		BTNode<T> getRightNode(BTNode<T> parent) 
			//结点的存储位置
			int pos= this->findIndex(parent);
			if ((2*pos+1)>this->size) 
				return 0,\\0;
			 else 
                 //说明存在右子结点
				return this->elem[pos*2+1];
			
		 
    	//得到结点的父结点
		BTNode<T> getParentNode(BTNode<T> node) 
			//结点的存储位置
			int pos= this->findIndex(node);
			if ( pos==1) 
                 //根结点,没有父结点
				return 0,\\0;
			 else 
                 //有
				return this->elem[ pos/2 ];
			
		  
    	//删除结点
		int delNode() 
		//遍历所有结点
		void showAll() 
			for(int i=1; i<=size; i++) 
				this->elem[i].desc();
				if( i*2<=size ) 
					cout<<"\\t左";
					this->elem[i*2].desc();
				
				if( i*2+1<=size) 
					cout<<"\\t右";
					this->elem[i*2+1].desc();
				
			
		
;

测试:

int main(int argc, char** argv) 
	//创建树
	BinaryTree<char> tree(A,\\0);
	//返回根结点
	BTNode<char> root= tree.getRoot();
	//为根结点添加子结点
	BTNode<char> bNode= tree.addNewNode(root,B);
	BTNode<char> cNode= tree.addNewNode(root,C);
	//为 B结点添加子结点
	BTNode<char> dNode= tree.addNewNode(bNode,D);
	BTNode<char> eNode= tree.addNewNode(bNode,E);
	//为 C结点添加子结点
	BTNode<char> fNode= tree.addNewNode(cNode,F);
	//遍历所有结点
	tree.showAll();
	cout<<"B 结点的左子结点:";
	tree.getLeftNode(bNode).desc();
	cout<<"B 结点的右子结点:"   ;
	tree.getRightNode(bNode).desc();
	return 0;

输出结果:

简单讨论一下完全二叉树的删除方法。

  • 如果删除的是最后一个结点,因不涉及到牵一发动全身的问题,直接删除便是。

  • 如果删除的不是最后一个结点,为了保持完全二叉树特性,可以采用复制最后一个结点的方式。如下删除 B 结点。

可以把最后的结点K复制过来。当然,前提是不在意谁一定是谁的前驱,谁一定是谁的后驱,如在描述家族关系的二叉树中,就不能这么做,否则,孙子会一转身成为祖辈。

删除函数的实现:

//删除结点
int delNode(BTNode<T> node)
    //查找结点位置
    int pos= this->findIndex(node); 
    if (pos*2>this->size )
        //最后一个子结点,直接删除
        this->elem[pos]=0,\\0;
        this->size--; 
        return true;
    else
        //把最后一个结点复制到要删除的结点位置
        this->elem[pos]=this->elem[this->size];	
        this->size--; 	
        return true;		 
    
    return false;
 

测试删除:

int main(int argc, char** argv) 
	//创建树
	BinaryTree<char> tree(A,\\0);
	//返回根结点
	BTNode<char> root= tree.getRoot();
	//为根结点添加子结点
	BTNode<char> bNode= tree.addNewNode(root,B);
	BTNode<char> cNode= tree.addNewNode(root,C);
	//为 B结点添加子结点
	BTNode<char> dNode= tree.addNewNode(bNode,D);
	BTNode<char> eNode= tree.addNewNode(bNode,E);
	//为 C结点添加子结点
	BTNode<char> fNode= tree.addNewNode(cNode,F);
	cout<<"原完全二叉树:"<<endl;
	tree.showAll();
	cout<<"删除最后一个结点:"<<endl;
	tree.delNode(fNode);
	tree.showAll();
	//删除 B 结点
	cout<<"删除B结点:"<<endl;
	tree.delNode(bNode);
	tree.showAll();
	return 0;

输出结果:

2.2 链式存储

使用顺序表存储完全二叉树是可行,若不是完全二叉树,为了保留父子之间关系的数学特性,则需要在数组中使用留空方式为没有子结点的结点虚拟出空子结点(甚至需要为虚拟结点再虚拟子结点)。

如下图所示,留空的下标为 4的位置就是为B结点虚拟的左子结点……如此必然造成空间的严重浪费。

为了保证每一个结点都能被存储,如果存储有n个结点的二叉树,至少需要 2<sup>n</sup>-1个存储空间。显然这是无法接受的。

使用链表存储二叉树方是常态。一般情形下,树的结点类型至少有 3 个存储位:

  • 数据位。
  • 左子结点指针位。
  • 右子结点指针位。

如上的结点类型设计,查找结点的子结点是方便的,但是,查找结点的父结点颇为不易。在对树的操作时,若有查找父亲结点的需求,可以在结点类型中添加一个父结点指针位。

2.1 编码实现

如下实现时,仅实现二叉树的链式存储,暂不涉及遍历、查找、删除等操作。

  • 定义结点类型:存储结点承载的值以及结点之间的关系信息。
#include <iostream>
using namespace std;
template<typename T>
struct BTNode_ 
	//编号(唯一标识符)
	int code;
	//结点的值
	T data;
	//左子结点地址
	BTNode_ *left;
	//右子结点地址
	BTNode_ *right;
    //无参构造
	BTNode_() 
		this->left=NULL;
		this->right=NULL;
	
    //有参构造
	BTNode_(int code,T val) 
		this->code=code;
		this->data=val;
		this->left=NULL;
		this->right=NULL;
	
	//自我显示
	void desc() 
		cout<<"结点:"<<this->code<<"_"<<this->data<<endl;
	
;
  • 定义树类型: 提供树的常规操作。
template<typename T>
class Tree_ 
	private:
		//树的根结点
		BTNode_<T> *root;
		//流水编号,从 1 开始(从 0 开始也可以)
		int idx=1;
		//尺寸
		int size=0;
	public:
		//初始化根结点
		Tree_(T val) 
             //创建根结点
			this->root=new BTNode_<T>(this->idx++,val);
             //大小增加
			this->size++;
		
		//返回根结点
		BTNode_<T> *getRoot() 
			return this->root;
		
		//析构函数
		~Tree_() 
            this->deleteAll();
		
		//添加左子结点
		BTNode_<T> * addLeftNode(BTNode_<T> * parent,T val) 
			if (parent==NULL)
				return NULL;
			//创建新结点
			BTNode_<T> *newNode=new BTNode_<T>(this->idx++,val);
			if (newNode==NULL)
				return NULL;
			parent->left=newNode;
			this->size++;
			return newNode;
		
		//添加右子结点
		BTNode_<T> * addRightNode(BTNode_<T> * parent,T val) 
			if (parent==NULL)
				return NULL;
			//创建新结点
			BTNode_<T> *newNode=new BTNode_<T>(this->idx++,val);
			if (newNode==NULL)
				return NULL;
			parent->right=newNode;
			this->size++;
			return newNode;
		
		//删除指定子树
		void destroy(BTNode_<T> * node) 
            if(node!=NULL) 
                deleteSubTree(node->left);
                deleteSubTree(node->right);
                delete node;
			
		
		//删除整棵树
		void deleteAll() 
			destroy(this->root);
			root=NULL;
		
		//前序遍历
		void  preorder(BTNode_<T> *node) 
			if (node!=NULL) 
				node->desc();
				preorder(node->left);
				preorder(node->right);
			
		
;

测试: 使用链表存储如下二叉树,并使用前序遍历检查树结构的正确性。

int main() 
	//创建树
	Tree_<char> tree(A);
	//得到根结点
	BTNode_<char> *root=tree.getRoot();
	//添加 B 为根结点的左子结点
	BTNode_<char> *bNode =tree.addLeftNode(root,B);
	//添加 C 为根结点的左子结点
	BTNode_<char> *cNode =tree.addRightNode(root,C);
	//添加 E 为B 结点的右子结点
	BTNode_<char> *eNode =tree.addRightNode(bNode,E);
	//添加 G 为 C 结点的右子结点
	BTNode_<char> *gNode =tree.addRightNode(cNode,G);
	//添加 H  为 G 结点的右子结点
	BTNode_<char> *hNode =tree.addRightNode(gNode,H);
	//前序遍历
	tree.preorder(root);
	return 0;

输出结果:

3. 总结

本文讲解了完全二叉树的特性,以及使用此特性实现完全二叉树的顺序存储。

对于非完全二叉树,并不适合顺序存储,使用链式存储更方便。

本文着重于如何存储,并提供了相应的测试代码。代码仅是服务本文的需求,实际应用时,可根据需求进行修改。

本文同时收录至"编程驿站"公众号。

以上是关于C++ 不知树系列之认识二叉树(顺序链表存储的实现)的主要内容,如果未能解决你的问题,请参考以下文章

10.29-11.4博客精彩回顾

C++ 不知树系列之二叉排序树(递归和非递归遍历删除插入……)

数据结构 · 二叉树转换为双向链表

1、创建一棵二叉树,以二叉链表作存储结构,实现先根遍历算法 2、创建一棵二叉树,实现先根遍历算法、中根

剑指offer系列——59/60.按之字形顺序打印二叉树/把二叉树打印成多行

风哥带你手撕算法之吃透二叉树