算法分析-堆排序 Heap Sort

Posted 2020-08-10 暗影侠客

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了算法分析-堆排序 Heap Sort相关的知识，希望对你有一定的参考价值。

堆排序的是集合了插入排序的单数组操作，又有归并排序的时间复杂度，完美的结合了2者的优点。

堆的定义

　　n个元素的序列{k₁，k₂，…,k_n}当且仅当满足下列关系之一时，称之为堆。

　　情形1：k_i<= k_2i且k_i<= k_2i+1（最小化堆或小顶堆）

　　情形2：k_i>= k_2i且k_i>= k_2i+1 （最大化堆或大顶堆）

　　其中i=1,2,…,n/2向下取整;

若将和此序列对应的一维数组（即以一维数组作此序列的存储结构）看成是一个完全二叉树，则堆的含义表明，完全二叉树中所有非终端结点的值均不大于（或不小于）其左、右孩子结点的值。

由此，若序列{k₁，k₂，…,k_n}是堆，则堆顶元素（或完全二叉树的根）必为序列中n个元素的最小值（或最大值）。

　　例如，下列两个序列为堆，对应的完全二叉树如图：

　　若在输出堆顶的最小值之后，使得剩余n-1个元素的序列重又建成一个堆，则得到n个元素的次小值。如此反复执行，便能得到一个有序序列，这个过程称之为堆排序。

　　堆排序（Heap Sort）只需要一个记录元素大小的辅助空间（供交换用），每个待排序的记录仅占有一个存储空间。

堆的存储

　　一般用数组来表示堆，若根结点存在序号0处， i结点的父结点下标就为(i-1)/2。i结点的左右子结点下标分别为2*i+1和2*i+2。

　　（注：如果根结点是从1开始，则左右孩子结点分别是2i和2i+1。）

　　如第0个结点左右子结点下标分别为1和2。

　　如最大化堆如下：

　　左图为其存储结构，右图为其逻辑结构。

堆排序的实现

　　实现堆排序需要解决两个问题：

　　　　1.如何由一个无序序列建成一个堆？

　　　　2.如何在输出堆顶元素之后，调整剩余元素成为一个新的堆？

　　先考虑第二个问题，一般在输出堆顶元素之后，视为将这个元素排除，然后用表中最后一个元素填补它的位置，自上向下进行调整：首先将堆顶元素和它的左右子树的根结点进行比较，把最小的元素交换到堆顶；然后顺着被破坏的路径一路调整下去，直至叶子结点，就得到新的堆。

　　我们称这个自堆顶至叶子的调整过程为“筛选”。

　　从无序序列建立堆的过程就是一个反复“筛选”的过程。

构造初始堆

　　初始化堆的时候是对所有的非叶子结点进行筛选。

　　最后一个非终端元素的下标是[n/2]向下取整，所以筛选只需要从第[n/2]向下取整个元素开始，从后往前进行调整。

　　比如，给定一个数组，首先根据该数组元素构造一个完全二叉树。

　　然后从最后一个非叶子结点开始，每次都是从父结点、左孩子、右孩子中进行比较交换，交换可能会引起孩子结点不满足堆的性质，所以每次交换之后需要重新对被交换的孩子结点进行调整。

进行堆排序

　　有了初始堆之后就可以进行排序了。

　　堆排序是一种选择排序。建立的初始堆为初始的无序区。

　　排序开始，首先输出堆顶元素（因为它是最值），将堆顶元素和最后一个元素交换，这样，第n个位置（即最后一个位置）作为有序区，前n-1个位置仍是无序区，对无序区进行调整，得到堆之后，再交换堆顶和最后一个元素，这样有序区长度变为2。。。

　　不断进行此操作，将剩下的元素重新调整为堆，然后输出堆顶元素到有序区。每次交换都导致无序区-1，有序区+1。不断重复此过程直到有序区长度增长为n-1，排序完成。

堆排序实例

　　首先，建立初始的堆结构如图：

　　然后，交换堆顶的元素和最后一个元素，此时最后一个位置作为有序区（有序区显示为黄色），然后进行其他无序区的堆调整，重新得到大顶堆后，交换堆顶和倒数第二个元素的位置……

　　重复此过程：

　　最后，有序区扩展完成即排序完成：

　　由排序过程可见，若想得到升序，则建立大顶堆，若想得到降序，则建立小顶堆。

代码

　　假设排列的元素为整型，且元素的关键字为其本身。

　　因为要进行升序排列，所以用大顶堆。

　　根结点从0开始，所以i结点的左右孩子结点的下标为2i+1和2i+2。

 1 //将父节点的值和最大值交换
 2 Array.prototype.swap = function (i, j) {
 3     var temp = this[i];
 4     this[i] = this[j];
 5     this[j] = temp;
 6 };
 7 
 8 //生成以i为根节点的最大堆
 9 Array.prototype.MAX_HEAPTIFY = function (i) {
10     var largest = i;
11     var left = i * 2 + 1; //左孩子节点坐标
12     var right = i * 2 + 2; //右孩子节点坐标
13 
14     if (left < heap_size && this[left] > this[largest]) { //这其实是一个剪枝的过程，因为heap_size后面都是排序好的。
15         largest = left;
16     }
17     if (right < heap_size && this[right] > this[largest]) {
18         largest = right;
19     }
20     if (largest !== i) {
21         this.swap(i, largest);
22         arguments.callee.call(this, largest);
23     }
24 };
25 
26 //生产堆
27 Array.prototype.BUILD_HEAP = function () {
28     var lastP = Math.floor(this.length / 2) - 1;  //最后一个非叶子节点。
29     for (var k = lastP; k >= 0; k--) {
30         this.MAX_HEAPTIFY(k);
31     }
32 };
33 
34 //主程序
35 Array.prototype.HEAP_SORT = function () {
36     this.BUILD_HEAP(); //生成最大堆
37     for (var i = this.length - 1; i > 0; i--) {
38         this.swap(0, i); //将最大的数即第一个元素放到最后。
39         heap_size = i;
40         this.MAX_HEAPTIFY(0);
41     }
42 };
43 
44 var A = [3, 4, 5, 1, 2, 6, 8, 3];
45 var heap_size = A.length; //包括heap_size在内的后面的坐标，都是排序好的。
46 A.HEAP_SORT();
47 console.log(A);

如果对上诉描述还是不清楚，下面给出算法导论里的习题，方面大家一步步更深的理解：

习题一：当A[i]比其两子女都大的时候，调用MAX-HEAPIFY(A,i)的效果是怎么样?

答案：其实没变化的，我们可以看最后的if(largest!=i),才会递归下去，不然不变。这是算法导论里的伪代码：

习题二:对i>heap-size[A]/2,调用MAX-HEAPIFY(A,i)会怎么样？

分析：我们知道heap-size[A]后面都是排好序的，那heap-size[A]/2的位置便是最后一个非叶子节点，

当

习题三:MAX-HEAPIFY效率虽然高，但是第十行，可能导致某些编译程序产生出低效的代码，请把递归改成迭代：

 1 Max-Heapify(A, i)
 2     while true
 3         l = Left(A, i)
 4         r = Right(A, i)
 5         if l <= A.heap-size and A[l] > A[i]
 6             largest = l
 7         else
 8             largest = i
 9         if r <= A.heap-size and A[r] > A[largest]
10             largest = r
11         if largest != i
12             swap A[i] with A[largest]
13             i = largest
14         else
15             break

整个堆排序的算法：

到此为止，堆排序已经全部讲解完了，我们发现核心的函数就MAX-HEAPTITY,他的时间复杂度其实是和这个二叉树的高度成正比的，我们可以认为是O(lgn).步骤就是先建立一个堆，建完就把第一个元素【最大或者最小】放到最后，如此循环，只到全部排序完毕。

虽然堆排序很优秀，但是快排其实用的更多，但是代表堆排序作用小，最小/最大优先级队列其实是搜索查找的启蒙算法。他就是基于堆排 .

 1 //生成以i为根节点的最大堆
 2 Array.prototype.MAX_HEAPTIFY = function (i) {
 3     var largest = i;
 4     var left = i * 2 + 1; //左孩子节点坐标
 5     var right = i * 2 + 2; //右孩子节点坐标
 6 
 7     if (left < heap_size && this[left] > this[largest]) { //这其实是一个剪枝的过程，因为heap_size后面都是排序好的。
 8         largest = left;
 9     }
10     if (right < heap_size && this[right] > this[largest]) {
11         largest = right;
12     }
13     if (largest !== i) {
14         this.swap(i, largest);
15         arguments.callee.call(this, largest);
16     }
17 };
18 
19 //将父节点的值和最大值交换
20 Array.prototype.swap = function (i, j) {
21     var temp = this[i];
22     this[i] = this[j];
23     this[j] = temp;
24 };
25 
26 //生产最大堆
27 Array.prototype.BUILD_HEAP = function () {
28     var lastP = Math.floor(this.length / 2) - 1;  //最后一个非叶子节点。
29     for (var k = lastP; k >= 0; k--) {
30         this.MAX_HEAPTIFY(k);
31     }
32 };
33 
34 //返回集合中子最大的关键字
35 Array.prototype.HEAP_MAXIMUM = function () {
36     return this[0]
37 };
38 
39 //去掉并返回集合中的具有最大关键字的元素
40 Array.prototype.HEAP_EXTRACT_MAX = function () {
41     //if (heap_size2 < 1) {
42     //必须保证有元素
43     if (this.length < 1) {
44         throw new Error("heap underflow");
45     }
46     var max = this[0];
47     //this[0] = this[heap_size2]; //把最后一个元素放到最前面，
48     this[0] = this[this.length-1]; //把最后一个元素放到最前面，
49     this.pop(); //将最后一个元素删除
50    // --heap_size2; //此时因为弹出了一个元素，存储就少了
51     this.MAX_HEAPTIFY(0);
52     return max;
53 
54 };
55 //将元素x的关键字的值增加到k
56 Array.prototype.HEAP_INCREASE_KEY = function (i, key) {
57     if (key < this[i]) {
58         throw new Error("太小了");
59     }
60     this[i] = key;
61     function parent(x) {
62         return Math.floor(x / 2);
63     }
64 
65     while (i > 0 && this[parent(i)] < key) {
66         this.swap(parent(i), i);
67         i = parent(i);
68     }
69 };
70 
71 
72 //把元素key插入集合
73 Array.prototype.MAX_HEAP_INSERT = function (key) {
74     // heap_size2++;
75     // this[heap_size2] = Number.NEGATIVE_INFINITY;
76     this[this.length] = Number.NEGATIVE_INFINITY;
77     //this.HEAP_INCREASE_KEY(heap_size2, key);
78     this.HEAP_INCREASE_KEY(this.length - 1, key);
79 };
80 
81 
82 var A = [4, 9, 3, 11, 7, 22, 6, 8, 33, 57, 2, 5, 8];
83 var heap_size = A.length;
84 //var heap_size2 = A.length - 1;
85 A.BUILD_HEAP();
86 console.log(A);
87 console.log(A.HEAP_MAXIMUM());
88 console.log(A.HEAP_EXTRACT_MAX());
89 console.log(A);
90 A.MAX_HEAP_INSERT(100);
91 console.log(A);
92 A.HEAP_INCREASE_KEY(1, 99);
93 console.log(A);

以上是关于算法分析-堆排序 Heap Sort的主要内容，如果未能解决你的问题，请参考以下文章