9.STL简单binary heap的实现

Posted chengonghao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了9.STL简单binary heap的实现相关的知识,希望对你有一定的参考价值。

         我用VS2013写的程序(github ),queue版本的代码位于cghSTL/version/cghSTL-0.3.6.rar

         所谓binary heap就是一种完全二叉树,也就是说,整颗binary tree除了对底层的叶节点外,是填满的,而最底层的叶节点由左至右不能有空隙。

         完全二叉树内没有任何节点漏洞,这带来一个极大的好处:我们可以利用vector来存储所有节点。我们把vector的0号元素保留,那么当完全二叉树的某个节点位于vector的i处时,其左子树必然位于2i处,右子树必然位于2i + 1处,其父节点必然位于i / 2处。通过这么简单的规则,vector就能轻易实现完全二叉树。

         我们需要的工具很简单:一个array和一组heap算法(用来添加、删除元素,将某组数组排列成binary heap)。

         根据元素排列规则,heap分为max-heap和min-heap,前者每个节点的值大于等于子节点,后者每个节点的值小于等于子节点。我们接下来构建的是max-heap。

Binary heap的实现需要以下几个文件:

1.      globalConstruct.h,构造和析构函数文件,位于cghSTL/allocator/cghAllocator/

2.      cghAlloc.h,空间配置器文件,位于cghSTL/allocator/cghAllocator/

3.      cghHeap.h,cghHeap的实现,位于cghSTL/sequence containers/cghHeap/

4.      test_cghHeap.cpp,测试代码,位于cghSTL/test/

 

介绍两个核心算法:

      1.push_heap算法

         新加入的元素一定要放在最下层作为叶节点,并填补在从左至右的第一个空格处。为满足max-heap的条件(每个节点的值大于等于其子节点的值),我们要执行上溯(percolate up)程序:将新加入的节点拿来与其父节点比较,如果值比父节点大,就父子对换位置,一直上溯,直到不需要对换或直到跟节点为止。


2.pop_heap算法

         Pop操作取走根节点(max-heap中根节点值最大)。为了满足每个节点的值都大于子节点,我们需要执行下溯(percolate down)程序:割舍最下层最右边的叶节点,并将其值重新安插到max-heap中(要重新调整max-heap的结构),然后将空间节点和其较大子节点对调,并持续下放,直至叶节点为止,并将前述被割舍元素的值设置给这个“已到达叶层的空节点”,再对它执行一次percolate up(上溯)。

 

下面进入正题,介绍heap的代码

 

1.构造与析构

先看第一个,globalConstruct.h构造函数文件

/*******************************************************************
*  Copyright(c) 2016 Chen Gonghao
*  All rights reserved.
*
*  chengonghao@yeah.net
*
*  功能:全局构造和析构的实现代码
******************************************************************/



#include "stdafx.h"
#include <new.h>
#include <type_traits>

#ifndef _CGH_GLOBAL_CONSTRUCT_
#define _CGH_GLOBAL_CONSTRUCT_

namespace CGH
{
	#pragma region 统一的构造析构函数
	template<class T1, class  T2>
	inline void construct(T1* p, const T2& value)
	{
		new (p)T1(value);
	}

	template<class T>
	inline void destroy(T* pointer)
	{
		pointer->~T();
	}

	template<class ForwardIterator>
	inline void destroy(ForwardIterator first, ForwardIterator last)
	{
		// 本来在这里要使用特性萃取机(traits编程技巧)判断元素是否为non-trivial
		// non-trivial的元素可以直接释放内存
		// trivial的元素要做调用析构函数,然后释放内存
		for (; first < last; ++first)
			destroy(&*first);
	}
	#pragma endregion 
}

#endif


按照STL的接口规范,正确的顺序是先分配内存然后构造元素。构造函数的实现采用placement new的方式;为了简化起见,我直接调用析构函数来销毁元素,而在考虑效率的情况下一般会先判断元素是否为non-trivial类型。

关于 trivial 和 non-trivial 的含义,参见:stack overflow

 

2.空间配置器

cghAlloc.h是空间配置器文件,空间配置器负责内存的申请和回收。

/*******************************************************************
*  Copyright(c) 2016 Chen Gonghao
*  All rights reserved.
*
*  chengonghao@yeah.net
*
*  功能:cghAllocator空间配置器的实现代码
******************************************************************/

#ifndef _CGH_ALLOC_
#define _CGH_ALLOC_

#include <new>
#include <cstddef>
#include <cstdlib>
#include <climits>
#include <iostream>


namespace CGH
{
	#pragma region 内存分配和释放函数、元素的构造和析构函数
	// 内存分配
	template<class T>
	inline T* _allocate(ptrdiff_t size, T*)
	{
		set_new_handler(0);
		T* tmp = (T*)(::operator new((size_t)(size * sizeof(T))));
		if (tmp == 0)
		{
			std::cerr << "out of memory" << std::endl;
			exit(1);
		}
		return tmp;
	}

	// 内存释放
	template<class T>
	inline void _deallocate(T* buffer)
	{
		::operator delete(buffer);
	}

	// 元素构造
	template<class T1, class  T2>
	inline void _construct(T1* p, const T2& value)
	{
		new(p)T1(value);
	}

	// 元素析构
	template<class T>
	inline void _destroy(T* ptr)
	{
		ptr->~T();
	}
	#pragma endregion

	#pragma region cghAllocator空间配置器的实现
	template<class T>
	class cghAllocator
	{
	public:
		typedef T			value_type;
		typedef T*			pointer;
		typedef const T*	const_pointer;
		typedef T&			reference;
		typedef const T&	const_reference;
		typedef size_t		size_type;
		typedef ptrdiff_t	difference_type;

		template<class U>
		struct rebind
		{
			typedef cghAllocator<U> other;
		};

		static pointer allocate(size_type n, const void* hint = 0)
		{
			return _allocate((difference_type)n, (pointer)0);
		}

		static void deallocate(pointer p, size_type n)
		{
			_deallocate(p);
		}

		static void deallocate(void* p)
		{
			_deallocate(p);
		}

		void construct(pointer p, const T& value)
		{
			_construct(p, value);
		}

		void destroy(pointer p)
		{
			_destroy(p);
		}

		pointer address(reference x)
		{
			return (pointer)&x;
		}

		const_pointer const_address(const_reference x)
		{
			return (const_pointer)&x;
		}

		size_type max_size() const
		{
			return size_type(UINT_MAX / sizeof(T));
		}
	};
	#pragma endregion

	#pragma region 封装STL标准的空间配置器接口
	template<class T, class Alloc = cghAllocator<T>>
	class simple_alloc
	{
	public:
		static T* allocate(size_t n)
		{
			return 0 == n ? 0 : (T*)Alloc::allocate(n*sizeof(T));
		}

		static T* allocate(void)
		{
			return (T*)Alloc::allocate(sizeof(T));
		}

		static void deallocate(T* p, size_t n)
		{
			if (0 != n)Alloc::deallocate(p, n*sizeof(T));
		}

		static void deallocate(void* p)
		{
			Alloc::deallocate(p);
		}
	};
	#pragma endregion
}

#endif



classcghAllocator是空间配置器类的定义,主要的四个函数的意义如下:allocate函数分配内存,deallocate函数释放内存,construct构造元素,destroy析构元素。这四个函数最终都是通过调用_allocate、_deallocate、_construct、_destroy这四个内联函数实现功能。

我们自己写的空间配置器必须封装一层STL的标准接口,

template<classT, class Alloc = cghAllocator<T>>
classsimple_alloc


         构造与析构函数、空间配置器是最最基本,最最底层的部件,把底层搭建好之后我们就可以着手设计cghHeap了。

 

3.cghHeap的实现

我把cghHeap的内部结构分为以下部分

1.      一堆typedef、成员变量的声明;

2.      cghHeap的构造与析构函数,以及构造与析构的辅助函数;

3.      cghHeap的读操作;

4.      cghHeap的写操作,以及写操作的辅助函数;

 

cghHeap代码的注释已经写得十分详细了,有疑问的地方我都给出了说明,童鞋们可以参考cghHeap的内部结构来总体把握cghHeap的框架,通过注释来理解cghHeap的工作原理。

 

cghHeap.h代码如下:

/*******************************************************************
*  Copyright(c) 2016 Chen Gonghao
*  All rights reserved.
*
*  chengonghao@yeah.net
*
*  文件名称:cghHeap容器的实现
******************************************************************/

#ifndef _CGH_HEAP_
#define _CGH_HEAP_

#include <memory>
#include "globalConstruct.h"
#include "cghAlloc.h"
namespace CGH
{
	template<class T, class Alloc = cghAllocator<T>>
	class cghHeap
	{
	public:
		typedef T				value_type;
		typedef value_type*		pointer;
		typedef value_type*		iterator;
		typedef value_type&		reference;
		typedef size_t			size_type;
		typedef ptrdiff_t		difference_type;
		
	protected:
		typedef simple_alloc<value_type, Alloc> data_allocator; // 定义空间配置器
		iterator start;
		iterator finish;
		iterator end_of_storage;

		#pragma region 构造和析构的辅助函数
		/*
		*	fill_initialize和allocate_and_fill把cghHeap的初始化分为了两步:
		*	1.fill_initialize的职责是分配一段内存
		*	2.fill_initialize调用allocate_and_fill,在分配的内存中调用构造函数创建cghHeap的元素
		*/
		void fill_initialize(size_type n, const T& value)
		{
			start = allocate_and_fill(n, value);
			finish = start + n;
			end_of_storage = finish;
		}

		iterator allocate_and_fill(size_type n, const T& x)
		{
			iterator result = data_allocator::allocate(n);
			iterator cur = result;
			for (; n > 0; --n, ++cur)
			{
				construct(&*cur, x);
			}
			return result;
		}

		/*
		*	释放内存,析构对象
		*/
		void deallocate()
		{
			if (start)
			{
				data_allocator::deallocate(start, end_of_storage - start);
			}
		}
		#pragma endregion

	public:

		#pragma region 构造函数和析构函数

		cghHeap() :start(0), finish(0), end_of_storage(0) { } // 初始化空的cghHeap
		cghHeap(size_type n, const T& value){ fill_initialize(n, value); } // 初始化包含n个值为value的cghHeap
		cghHeap(int n, const T& value){ fill_initialize(n, value); } // 同上
		cghHeap(long n, const T& value){ fill_initialize(n, value); } // 同上
		explicit cghHeap(size_type n){ fill_initialize(n, T()); } // 初始化cghHeap的长度为n

		~cghHeap()
		{
			destroy(start, finish); // 先调用cghHeap中元素的析构函数
			deallocate(); // 再释放cghHeap占用的内存
		}

		#pragma endregion 

		#pragma region cghHeap的读操作
		iterator begin(){ return start; } // 返回cghHeap头元素的地址
		iterator end(){ return finish; } // 返回cghHeap尾元素的地址
		size_type size(){ return size_type(int(end() - begin())); } // cghHeap的长度 = 尾元素地址 - 头元素地址
		#pragma endregion
						
		#pragma region cghHeap的写操作

		/**
		*  在cghHeap末尾插入一个元素
		*/
		void push_back(const T& x)
		{
			// 判断cghHeap的容量是否满了,如果没满我们直接在已有的内存区域上构造元素
			if (finish != end_of_storage)
			{
				construct(finish, x);
				++finish;
			}
			else // 如果满了我们就要重新分配内存并重新构造函数
			{
				insert_aux(end(), x);
			}
		}

		/**
		*  弹出尾元素
		*/
		void pop_back()
		{
			--finish;
			destroy(finish);
		}

		inline void make_heap(iterator first, iterator last)
		{
			if (last - first < 2)return;
			difference_type len = last - first;
			difference_type parent = len / 2;
			while (true)
			{
				_adjust_heap(first, parent, len, T(*(first + parent)));
				if (parent == 0)return;
				--parent;
			}
		}

		inline void push_heap(iterator first, iterator last)
		{
			difference_type holeIndex = last - first - 1;
			difference_type topIndex = 0;
			T value = T(*(last - 1));
			_push_heap(first, holeIndex, topIndex, value);
		}

		inline void pop_heap(iterator first, iterator last)
		{
			__pop_heap(first, last - 1, last - 1, T(*(last - 1)));
		}

		inline void sort_heap(iterator first, iterator last)
		{
			while (last - first > 1)
			{
				pop_heap(first, last--);
			}
		}

		#pragma endregion
	protected:
		#pragma region cghHeap写操作辅助操作

		void insert_aux(iterator position, const T& value)
		{
			if (finish != end_of_storage)
			{
				construct(finish, *(finish - 1));
				++finish;
				T x_copy = value;
				std::copy_backward(position, finish - 2, finish - 1);
				*position = x_copy;
			}
			else
			{
				ptrdiff_t old_size = size();
				const size_type len = old_size != 0 ? 2 * old_size : 1;
				/*
				配置原则:如果原大小为0,则配置1个元素大小
				如果原大小不为0,则配置原大小的两倍
				*/
				iterator new_start = data_allocator::allocate(len);
				iterator new_finish = new_start;
				try
				{
					// 把 start 到 position 这段内存拷贝到 new_start 处,返回 new_finish = new_start + ( position - start )
					new_finish = std::uninitialized_copy(start, position, new_start);
					construct(new_finish, value); // 在 new_finish 处构造新元素
					++new_finish;
					//new_finish = std::uninitialized_copy(position, finish, new_finish);
				}
				catch (std::exception ex)
				{
					// 如果执行失败就要回滚
					destroy(new_start, new_finish);
					data_allocator::deallocate(new_start, len);
					throw;
				}
				destroy(begin(), end());
				deallocate();
				start = new_start;
				finish = new_finish;
				end_of_storage = new_start + len;
			}
		}

		void __pop_heap(iterator first, iterator last, iterator result, T value)
		{
			*result = *first;
			_adjust_heap(first, difference_type(0), difference_type(last - first), value);
		}

		void _adjust_heap(iterator first, difference_type holeIndex, difference_type len, T value)
		{
			difference_type topIndex = holeIndex;
			difference_type secondChild = 2 * holeIndex + 2;
			while (secondChild < len)
			{
				if (*(first + secondChild) < *(first + (secondChild - 1)))
				{
					--secondChild;
				}
				*(first + holeIndex) = *(first + secondChild);
				holeIndex = secondChild;
				secondChild = 2 * (secondChild + 1);
			}
			if (secondChild == len)
			{
				*(first + holeIndex) = *(first + (secondChild - 1));
				holeIndex = secondChild - 1;
			}
			_push_heap(first, holeIndex, topIndex, value);
		}

		void _push_heap(iterator first, difference_type holeIndex, difference_type topIndex, T value)
		{
			difference_type parent = (holeIndex - 1) / 2;
			while (holeIndex>topIndex && *(first + parent) < value)
			{
				*(first + holeIndex) = *(first + parent);
				holeIndex = parent;
				parent = (holeIndex - 1) / 2;
			}
			*(first + holeIndex) = value;
		}

		#pragma endregion
	};
}

#endif


 

4.测试

测试环节的主要内容已在注释中说明

test_heap.cpp:

/*******************************************************************
*  Copyright(c) 2016 Chen Gonghao
*  All rights reserved.
*
*  chengonghao@yeah.net
*
*  文件名称:cghHeap容器的测试代码
******************************************************************/

#include "stdafx.h"
#include "cghHeap.h"
using namespace::std;

int _tmain(int argc, _TCHAR* argv[])
{
	using namespace::CGH;

	cghHeap<int> test1;
	std::cout << "************************ max-heap 生成测试************************" << endl << endl;
	std::cout << "依次压入元素:\\t0,1,2,3,4,8,9,3,5,我们要把压入的元素排成一颗完全二叉树" << endl << endl;
	test1.push_back(0);
	test1.push_back(1);
	test1.push_back(2);
	test1.push_back(3);
	test1.push_back(4);
	test1.push_back(8);
	test1.push_back(9);
	test1.push_back(3);
	test1.push_back(5);
	test1.make_heap(test1.begin(), test1.end()); // 生成heap
	std::cout << "生成 max-heap:\\t" ;
	for (cghHeap<int>::iterator it = test1.begin(); it != test1.end(); ++it)
	{
		std::cout << *it << ",";
	}
	std::cout << endl << endl;


	std::cout << "************************ max-heap 压入测试************************" << endl << endl;
	std::cout << "压入元素:\\t\\t7,压入后我们要对 max-heap 这颗完全二叉树重新排序" << endl << endl;
	test1.push_back(7);
	test1.push_heap(test1.begin(), test1.end()); // 重新排序
	std::cout << "压入 7 之后的 max-heap:\\t";
	for (cghHeap<int>::iterator it = test1.begin(); it != test1.end(); ++it)
	{
		std::cout << *it << ",";
	}
	std::cout << endl << endl;

	std::cout << "************************ max-heap 弹出测试************************" << endl << endl;
	std::cout << "我们只能弹出 max-heap 这颗二叉树的根节点" << endl << endl;
	test1.pop_heap(test1.begin(), test1.end());
	std::cout << "弹出根节点 9 之后的 max-heap:\\t";
	test1.pop_back();
	for (cghHeap<int>::iterator it = test1.begin(); it != test1.end(); ++it)
	{
		std::cout << *it << ",";
	}
	std::cout << endl << endl;

	system("pause");
	return 0;
}


生成测试中生成的序列为:9,5,8,3,4,0,2,3,1,对应的max-heap结构如下:


可以发现,每个节点的值都大于等于其子节点的值。

 

 

压入7之后的序列为:9,7,8,3,5,0,2,3,1,4,对应的max-heap如下:

 

         弹出根节点9之后的序列为:8,7,4,3,5,0,2,3,1,对应的max-heap如下:


以上是关于9.STL简单binary heap的实现的主要内容,如果未能解决你的问题,请参考以下文章

构造函数与析构函数

C++:对象和类|| 类的构造函数与析构函数

C++:对象和类|| 类的构造函数与析构函数

构造器与析构器

c++_构造与析构

c++_构造与析构