C++稳定排序和不稳定排序

Posted Treysure

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++稳定排序和不稳定排序相关的知识,希望对你有一定的参考价值。

      这几天笔试了好几次了,连续碰到一个关于常见排序算法稳定性判别的问题,往往还是多选,对于我以及和我一样拿不准的同学可不是一个能轻易下结论的题目,当然如果你笔试之前已经记住了数据结构书上哪些是稳定的,哪些不是稳定的,做起来应该可以轻松搞定。本文是针对老是记不住这个或者想真正明白到底为什么是稳定或者不稳定的人准备的。

      首先,排序算法的稳定性大家应该都知道,通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下,如果Ai = Aj,Ai原来在位置前,排序后Ai还是要在Aj位置前。

      其次,说一下稳定性的好处。排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。另外,如果排序算法稳定,对基于比较的排序算法而言,元素交换的次数可能会少一些(个人感觉,没有证实)。

回到主题,现在分析一下常见的排序算法的稳定性,每个都给出简单的理由。

(1)冒泡排序

冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无聊地把他们俩交换一下的;如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。

/* 冒泡排序
思想:垂直排列泡泡,轻气泡不能在重气泡之下
扫描趟数:n-1次

思考,可否进行小小的改进呢?设置exchange标志位,当不再发生交换时,停止做无用功
*/
#include <iostream>
#define debug 1
using namespace std;

int times = 0; // 计算复杂度

/* 冒泡排序 */
void bubble_Sort(int *a, int n)
	for (int i = 0; i < n-1; i++)	// 进行 n-1 趟扫描
		int temp, exchange=0;
		for (int j = n - 2; j >= i; j--)  // 从后往前交换
			++times;
			if (a[j+1] < a[j])
				temp = a[j+1];
				a[j+1] = a[j];
				a[j] = temp;
				exchange = 1; // 发生交换
			
		
		if (!exchange)  // 此趟没有再发生交换,说明已经是排序了的
			return;
	


void printArray(int *a, int n)
	for (int i = 0; i < n; i++)
		printf("%d ", a[i]);
	printf("\\n");


int main()
	//int a[] = 7, 3, 5, 8, 9, 1, 2, 4, 6;
	int a[] =  7, 3, 5, 8, 7, 1, 2, 4, 6 ;


	printArray(a, 9);
	bubble_Sort(a, 9);
	printArray(a, 9);
	printf("cal times:%d\\n", times);

#if debug
	system("pause");
#endif

	return 0;

(2)选择排序

选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n - 1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9,我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。

(3)插入排序 
插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。当然,刚开始这个有序的小序列只有1个元素,就是第一个元素。比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。

/* 直接插入排序【与抓扑克时整理扑克极为相似】
思想:有序区,无序区
插入趟数:n-1次

思考,可否进行小小的改进呢?不妨试一试将查找比较操作和记录移动操作交替进
*/
#include <iostream>
#define debug 1
using namespace std;

int times = 0; // 计算复杂度

/* 直接插入排序[从小到大] */
void directInsert_Sort(int *a, int n)
	for (int i = 1; i < n; i++)//第0个默认有序

		int j, temp = a[i]; // 暂存,查询比较完后取出填到有序数列中空缺位置
		for (j = i - 1; j >= 0 && a[j] > temp; j--)  // 从后往前查询比较
			a[j + 1] = a[j];  // 满足条件就往后挪一位
			++times;
		
		a[j + 1] = temp;
	


void printArray(int *a, int n)
	for (int i = 0; i < n; i++)
		printf("%d ",a[i]);
	printf("\\n");


int main()
	//int a[] = 7, 3, 5, 8, 9, 1, 2, 4, 6;
	int a[] =  7, 3, 5, 8, 7, 1, 2, 4, 6 ;


	printArray(a, 9);
	directInsert_Sort(a,9);
	printArray(a, 9);
	printf("cal times:%d\\n", times);

#if debug
	system("pause");
#endif

	return 0;

(4)快速排序 
快速排序有两个方向,左边的i下标一直往右走,当a[i] <= a[center_index],其中center_index是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j] > a[center_index]。如果i和j都走不动了,i <= j,交换a[i]和a[j],重复上面的过程,直到i > j。 交换a[j]和a[center_index],完成一趟快速排序。在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为5 3 3 4 3 8 9 10 11,现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定发生在中枢元素和a[j] 交换的时刻。

/* 快速排序
思想:划分交换 将大问题分解成若干个小问题。调用递归
插入趟数:

思考,不稳定,和希尔排序一样,会发生将相同元素掉个的情况
因为每次选中的pivot值,也就是基准值,他们是大增量移动,
与单增量移动不同,单增量移动不会影响相同元素的排列顺序
*/
#include <iostream>
#define debug 1
using namespace std;

int times = 0; // 计算复杂度

/* 快速排序[从小到大] */
void quick_Sort(int *a, int low, int high)// low: 1th element & high:last element
	int pivot;  // 基准
	if (low < high)
		pivot = a[low]; // 基准的选择比较随意,亦可取中间值
		int i = low, j = high; // 暂存

		/* 将比基准小的放在左边,大的放在右边 */
		while (i<j)
			while (i < j && a[j] >= pivot) // 右边部分
				j--;
			if (i < j)
				a[i++] = a[j]; // 将比pivot小的元素移到低端

			/* 不用担心数据被覆盖的问题,因为pivot暂存起来,之后
			的每一次覆盖,都是一个盖住一个,不会发生数据丢失的情况 */

			while (i < j && a[i] <= pivot) // 左边部分
				i++;
			if (i < j)
				a[j--] = a[i]; // 将比pivot大的元素移到高端
		

		a[i] = pivot; // pivot移到中间位置
		quick_Sort(a, low, i - 1);  // 对左区间递归排序
		quick_Sort(a, i + 1, high); // 对右区间递归排序
	


void printArray(int *a, int n)
	for (int i = 0; i < n; i++)
		printf("%d ", a[i]);
	printf("\\n");


int main()
	//int a[] = 7, 3, 5, 8, 9, 1, 2, 4, 6;
	int a[] =  7, 3, 5, 8, 7, 1, 2, 4, 6 ;


	printArray(a, 9);
	quick_Sort(a, 0, 8);
	printArray(a, 9);
	printf("cal times:%d\\n", times);

#if debug
	system("pause");
#endif

	return 0;

(5)归并排序 
归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列,不断合并直到原序列全部排好序。可以发现,在1个或2个元素时,1个元素不会交换,2个元素如果大小相等也没有人故意交换,这不会破坏稳定性。那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。所以,归并排序也是稳定的排序算法。

(6)基数排序 
基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。

(7)希尔排序(shell) 
希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小, 插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比O(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。

/* 希尔shell排序

思想:分组插入排序  组合并  直至组合并至1个  

思考,前一个程序直接插入排序中,查找插入操作对后续操作没有任何帮助。如果比较相隔较远
距离的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换。
*/

//? 没懂,相等的元素可能会分在不同组,导致它们的次序可能会发生变化,因此希尔排序是不稳定的
//解释:排序算法的稳定性,通俗形式化一下,如果Ai=Aj,Ai原来在位置前,排序后Ai还是要在Aj位置前。

#include <iostream>
using namespace std;
#define debug 1

int times = 0; // 计算复杂度

/* shell排序[从小到大] */
void shell_Sort(int *a, int n)
	for (int half = n/2; half >0; half=half/2) //增量每次缩小2倍

		/* stt */
		for (int i = half; i < n; i++)  // 这个for循环就是前面的插入排序
			int j, temp = a[i];
			for (j = i - half; j >= 0 && a[j] > temp; j-=half)
				a[j + half] = a[j];
				++times;
			
			a[j + half] = temp;
		
		/* end */

	


void printArray(int *a, int n)
	for (int i = 0; i < n; i++)
		printf("%d ", a[i]);
	printf("\\n");


int main()
	//int a[] = 7, 3, 5, 8, 9, 1, 2, 4, 6;
	int a[] =  7, 3, 5, 8, 7, 1, 2, 4, 6 ;

	printArray(a, 9);
	shell_Sort(a, 9);
	printArray(a, 9);
	printf("cal times:%d\\n", times);

#if debug
	system("pause");
#endif

	return 0;

(8)堆排序 
我们知道堆的结构是节点i的孩子为2 * i和2 * i + 1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。在一个长为n 的序列,堆排序的过程是从第n / 2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n / 2 - 1, n / 2 - 2, ... 1这些个父节点选择元素时,就会破坏稳定性。有可能第n / 2个父节点交换把后面一个元素交换过去了,而第n / 2 - 1个父节点把后面一个相同的元素没 有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法。

综上,得出结论: 选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,而冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法

以上是关于C++稳定排序和不稳定排序的主要内容,如果未能解决你的问题,请参考以下文章

稳定排序和不稳定排序

算法4稳定排序和不稳定排序

稳定排序和不稳定排序

转载-稳定排序和不稳定排序

稳定排序和不稳定排序的区别和代表

稳定的和不稳定的排序