概要
参考《大话数据结构》,把常用的基本数据结构梳理一下。
本节介绍二叉树。
定义
二叉树(Binary Tree)是 \\(n\\) (\\(n \\geqslant 0\\))个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二叉树的特点:
- 每个结点最多有两棵子树,所以二叉树中不存在度大于 \\(2\\) 的结点。
- 左子树和右子树是有顺序的,次序不能任意颠倒。
- 即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
对一棵具有 \\(n\\) 个结点的二叉树按层序编号,如果编号为 \\(i\\) (\\(1 \\leqslant i \\leqslant n\\))的结点与同样深度的满二叉树中编号为 \\(i\\) 的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。如图:
注意:首先满二叉树一定是一棵完全二叉树,但完全二叉树又不一定是满的,其次按层序编号相同的结点是一一对应的。从这里得出一些完全二叉树的特点:
- 叶子结点只能出现在最下两层
- 最下层的叶子一定集中在左部连续位置
- 倒数二层,若有叶子结点,一定都在右部连续位置
- 如果结点度为 \\(1\\),则该结点只有左孩子,即不存在只有右子树的情况
- 同样结点数的二叉树,完全二叉树的深度最小
二叉树的性质
性质 1: 在二叉树的第 \\(i\\) 层上至多有 \\(2^{i-1}\\) 个结点(\\(i \\geqslant 1\\))。
性质 2: 深度为 \\(k\\) 的二叉树至多有 \\(2^k-1\\) 个结点(\\(k \\geqslant 1\\))。
性质 3: 对任何一棵二叉树 \\(T\\),如果其终端结点数为 \\(n_0\\),度为 \\(2\\) 的结点数为 \\(n_2\\),则 \\(n_0 = n_2 +1\\).
说白了就是叶子结点数比度为 \\(2\\) 的结点数多一个。我们设 \\(n_1\\) 为度是 \\(1\\) 的结点数。则树 \\(T\\) 的结点总数 \\(n=n_0+n_1+n_2\\). 我们换个角度数一数树的连接线数,度为 \\(1\\) 的分支线为 \\(1\\) 条,度为 \\(2\\) 的分支线为 \\(2\\) 条,即共 \\(n_1+2n_2\\) 条,又显然树的连接树为结点总数减去 \\(1\\),即 \\(n-1 = n_1+ 2n_2\\),即 \\(n_0 = n_2 +1\\).
性质 4: 具有 \\(n\\) 个结点的完全二叉树的深度为 \\(floor(\\log_2n)+1\\)(\\(floor(x)\\) 表示不超过 \\(x\\) 的最大整数)。
性质 5: 如果对一棵有 \\(n\\) 个结点的完全二叉树(其深度为 \\(floor(\\log_2n)+1\\))的结点按层序编号(从第一层到 \\(floor(\\log_2n)+1\\) 层,每层从左到右),对任一结点 \\(i\\)(\\(1 \\leqslant i \\leqslant n\\))有:
- 如果 \\(i=1\\),则结点 \\(i\\) 是二叉树的根,无双亲;如果 \\(i>1\\),则其双亲是结点 \\(floor(i/2)\\).
- 如果 \\(2i>n\\),则结点 \\(i\\) 无左孩子(结点 \\(i\\) 为叶子结点);否则其左孩子是结点 \\(2i\\).
- 如果 \\(2i+1>n\\),则结点 \\(i\\) 无右孩子,否则其右孩子是结点 \\(2i+1\\).
可以与上图结点理解。
二叉树的存储结构
二叉树的顺序存储结构
二叉树的顺序存储结构是用一维数组存储二叉树的结点,并且结点的存储位置,也就是数组的下标要能体现结点之间的逻辑关系。比如下面一棵完全二叉树:
将这棵二叉树存入到数组中,相应的下标对应其同样的位置,如下图:
对于一般的二叉树,尽管层序编号不能反映逻辑关系,但是可以将其按完全二叉树编号,只不过,把不存在的结点设置为空就行了。但是像极端的情况比如深度为 \\(k\\) 的右斜树,它只有 \\(k\\) 个结点,却需要分配 \\(2^k-1\\) 个存储单元空间,造成了极大的空间浪费,所以顺序存储结构一般只用于完全二叉树。
二叉链表
二叉树每个结点最多有两个孩子,所以为它设计一个数据域和两个指针域是比较自然的想法,我们称这样的链表叫做二叉链表。如图:
其中 data 是数据域, lchild 和 rchild 都是指针域,分别存放指向左孩子和右孩子的指针。二叉链表的结点结构定义代码如下:
typedef int TElemType; // TElemType 类型根据实际情况而定,这里假设为 int
struct BiTNode
{
TElemType data;
BiTNode *lchild, *rchild;
};
如果有需要,还可以再增加一个指向双亲的指针域,那样就称之为三叉链表。
遍历二叉树
二叉树的遍历(traversing binary tree)是指从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。
二叉树的遍历方式很多,如果我们限制了从左到右的习惯方式,那么主要分为四种:
- 前序遍历。规则是若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树。如图,遍历顺序为:ABDGHCEIF.
- 中序遍历。规则是若二叉树为空,则空操作返回,否则从根结点开始(注意并不是先访问根结点),中序遍历根结点的左子树,然后访问根结点,最后中序遍历右子树。如图,遍历顺序为:GDHBAEICF.
- 后序遍历。规则是若二叉树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后是访问根结点。如图,遍历顺序为:GHDBIEFCA.
- 层序遍历。规则是若二叉树为空,则空操作返回,否则从树的第一层,也就是从根结点开始访问,从上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。如图,遍历顺序为:ABCDEFGHI.
二叉树树的建立与遍历代码实现
如果我们要在内存中建立一个如下左图这样的二叉树,为了能让每个结点确认是否有左右孩子,我们对它进行扩展,就右图的样子,也就是将二叉树中每个结点的空指针引出一个虚结点,其值为一个特定值,比如“#”。我们称这种处理后的二叉树为原二叉树的扩展二叉树。扩展二叉树就可以做到一个遍历序列确定一棵二叉树。比如右图的遍历序列就为 AB#D##C##.
有了这样的准备就可以着手建立二叉树了。创建二叉树同遍历方法一样,也有不同的创建方法。现在我们用前序实现二叉树的建议。代码如下:
#include<iostream>
#include<cstdio> //getchar()
using namespace std;
typedef char TElemType; // TElwmType 类型根据实际情况而定,这里假设为 int
struct BiTNode
{
TElemType data;
BiTNode *lchild, *rchild;
};
void CreateBiTree(BiTNode* (&T)) //这里传入的是指针的引用,因为牵扯到修改指针的值
{
//读入字符串 ch, 前序构造树
//cout<<"请输入创建一棵二叉树的结点数据"<<endl;
TElemType ch = getchar();
//cin>>ch;
if (ch == \'#\') //其中getchar()为逐个读入标准库函数
T = NULL;
else
{
T = new BiTNode;//产生新的子树
T->data = ch;
CreateBiTree(T->lchild);//递归创建左子树
CreateBiTree(T->rchild);//递归创建右子树
}
}
void PreOrderTraverse(BiTNode* T)
{
//前序遍历
if(T) //结点不为空时执行
{
cout<< T->data;
PreOrderTraverse(T->lchild);
PreOrderTraverse(T->rchild);
}
else
cout<<"";
}
void InOrderTraverse(BiTNode* T)
{
//中序遍历
if(T) //结点不为空时执行
{
InOrderTraverse(T->lchild);
cout<< T->data;
InOrderTraverse(T->rchild);
}
else
cout<<"";
}
void PostOrderTraverse(BiTNode* T)
{
//后序遍历
if(T) //结点不为空时执行
{
PostOrderTraverse(T->lchild);
PostOrderTraverse(T->rchild);
cout<< T->data;
}
else
cout<<"";
}
int main()
{
//const char* ch = "AB#D##C##";
BiTNode *T;
cout<<"创建树结构,请输入字符,‘#’ 代表空:"<<endl;
CreateBiTree(T); //输入 AB#D##C##
cout<<"创建完毕"<<endl;
cout<<T->data<<endl;
cout<<"前序遍历结果:"<<endl;
PreOrderTraverse(T);//输出 ABDC
cout<<endl;
cout<<"中序遍历结果:"<<endl;
InOrderTraverse(T); //输出 BDAC
cout<<endl;
cout<<"后序遍历结果:"<<endl;
PostOrderTraverse(T);//输出 DBCA
cout<<endl;
return 0;
}
上边主要的疑惑是指针的引用,暂时先参考二叉树建立,指针问题. 遇到修改指针的得注意了。