数据结构复习总结第八章排序
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据结构复习总结第八章排序相关的知识,希望对你有一定的参考价值。
参考技术A第八章排序
基本概念
文件有一组记录组成 记录有若干数据项组成 唯一标识记录的数据项称关键字;
排序是将文件按关键字的递增(减)顺序排列;
排序文件中有相同的关键字时 若排序后相对次序保持不变的称稳定排序 否则称不稳定排序;
在排序过程中 文件放在内存中处理不涉及数据的内 外存交换的称内部排序 反之称外部排序;
排序算法的基本操作 )比较关键字的大小; )改变指向记录的指针或移动记录本身
评价排序方法的标准 )执行时间; )所需辅助空间 辅助空间为O( )称就地排序;另要注意算法的复杂程度
若关键字类型没有比较运算符 可事先定义宏或函数表示比较运算
插入排序
直接插入排序
实现过程
void insertsort(seqlist R)
int i j;
for(i= ;i<=n;i++)
if(R[i] key< R[i ] key
R[ ]=R[i];j=i ;
doR[j+ ]=R[j];j ;
while(R[ ] key <r[j].key); p=""> </r[j].key);>
R[j+1]=R[0];
算法中引入监视哨R[0]的作用是:1)保存R[i]的副本;2)简化边界条件,防止循环下标越界。WiNgwit
关键字比较次数最大为(n+2)(n-1)/2;记录移动次数最大为(n+4)(n-1)/2;
算法的最好时间是O(n);最坏时间是O(n^2);平均时间是O(n^2);是一种就地的稳定的排序;
8.2.2希尔排序
实现过程:是将直接插入排序的间隔变为d。d的取值要注意:1)最后一次必为1;2)避免d值互为倍数;
关键字比较次数最大为n^1.25;记录移动次数最大为1.6n^1.25;
算法的平均时间是O(n^1.25);是一种就地的不稳定的排序;
8.3交换排序
8.3.1冒泡排序
实现过程:从下到上相邻两个比较,按小在上原则扫描一次,确定最小值,重复n-1次。
关键字比较次数最小为n-1、最大为n(n-1)/2;记录移动次数最小为0,最大为3n(n-1)/2;
算法的最好时间是O(n);最坏时间是O(n^2);平均时间是O(n^2);是一种就地的稳定的排序;
8.3.2快速排序
实现过程:将第一个值作为基准,设置i,j指针交替从两头与基准比较,有交换后,交换j,i。i=j时确定基准,并以其为界限将序列分为两段。重复以上步骤。
关键字比较次数最好为nlog2n+nC(1)、最坏为n(n-1)/2;
算法的最好时间是O(nlog2n);最坏时间是O(n^2);平均时间是O(nlog2n);辅助空间为O(log2n);是一种不稳定排序;
8.4选择排序
8.4.1直接选择排序
实现过程:选择序列中最小的插入第一位,在剩余的序列中重复上一步,共重复n-1次。
关键字比较次数为n(n-1)/2;记录移动次数最小为0,最大为3(n-1);
算法的最好时间是O(n^2);最坏时间是O(n^2);平均时间是O(n^2);是一种就地的不稳定的排序;
8.4.2堆排序
实现过程:把序列按层次填入完全二叉树,调整位置使双亲大于或小于孩子,建立初始大根或小根堆,调整树根与最后一个叶子的位置,排除该叶子重新调整位置。
算法的最好时间是O(nlog2n);最坏时间是O(nlog2n);平均时间是O(nlog2n);是一种就地的不稳定排序;
8.5归并排序
实现过程:将初始序列分为2个一组,最后单数轮空,对每一组排序后作为一个单元,对2个单元排序,直到结束。
算法的最好时间是O(nlog2n);最坏时间是O(nlog2n);平均时间是O(nlog2n);辅助空间为O(n);是一种稳定排序;
8.6分配排序
8.6.1箱排序
实现过程:按关键字的取值范围确定箱子的个数,将序列按关键字放入箱中,输出非空箱的关键字。
在桶内分配和收集,及对各桶进行插入排序的时间为O(n),算法的期望时间是O(n),最坏时间是O(n^2)。
8.6.2基数排序
实现过程:按基数设置箱子,对关键字从低位到高位依次进行箱排序。
算法的最好时间是O(d*n+d*rd);最坏时间是O(d*n+d*rd);平均时间是O(d*n+d*rd);辅助空间O(n+rd);是一种稳定排序;
8.7各种内部排序方法的比较和选择
按平均时间复杂度分为:
1) 平方阶排序:直接插入、直接选择、冒泡排序;
2) 线性对数阶:快速排序、堆排序、归并排序;
3) 指数阶:希尔排序;
4) 线性阶:箱排序、基数排序。
选择合适排序方法的因素:1)待排序的记录数;2)记录的大小;3)关键字的结构和初始状态;4)对稳定性的要求;5)语言工具的条件;6)存储结构;7)时间和辅助空间复杂度。
结论:
1) 若规模较小可采用直接插入或直接选择排序;
2) 若文件初始状态基本有序可采用直接插入、冒泡或随机快速排序;
3) 若规模较大可采用快速排序、堆排序或归并排序;
4) 任何借助于比较的排序,至少需要O(nlog2n)的时间,箱排序和基数排序只适用于有明显结构特征的关键字;
5) 有的语言没有提供指针及递归,使归并、快速、基数排序算法复杂;
6) 记录规模较大时为避免大量移动记录可用链表作为存储结构,如插入、归并、基数排序,但快速、堆排序在链表上难以实现,可提取关键字建立索引表,然后对索引表排序。
附二:
第八章排序
*************************************************************************************
记录中可用某一项来标识一个记录,则称为关键字项,该数据项的值称为关键字。
排序是使文件中的记录按关键字递增(或递减)次序排列起来。·基本操作:比较关键字大小;改变指向记录的指针或移动记录。
·存储结构:顺序结构、链表结构、索引结构。
经过排序后这些具有相同关键字的记录之间的相对次序保持不变,则称这种排序方法是稳定的,否则排序算法是不稳定的。
排序过程中不涉及数据的内、外存交换则称之为"内部排序"(内排序),反之,若存在数据的内外存交换,则称之为外排序。
内部排序方法可分五类:插入排序、选择排序、交换排序、归并排序和分配排序。
评价排序算法好坏的标准主要有两条:执行时间和所需的辅助空间,另外算法的复杂程序也是要考虑的一个因素。
*************************************************************************************
插入排序:·直接插入排序: ·逐个向前插入到合适位置。
·哨兵(监视哨)有两个作用: ·作为临变量存放R[i]
·是在查找循环中用来监视下标变量j是否越界。
·直接插入排序是就地的稳定排序。时间复杂度为O(n^2),比较次数为(n+2)(n-1)/2;移动次数为(n+4)(n-1)/2;
·希尔排序: ·等间隔的数据比较并按要求顺序排列,最后间隔为1。
·希尔排序是就地的不稳定排序。时间复杂度为O(n^1.25),比较次数为(n^1.25);移动次数为(1.6n^1.25);
交换排序:·冒泡排序:·自下向上确定最轻的一个。·自上向下确定最重的一个。·自下向上确定最轻的一个,后自上向下确定最重的一个。
·冒泡排序是就地的稳定排序。时间复杂度为O(n^2),比较次数为n(n-1)/2;移动次数为3n(n-1)/2;
·快速排序:·以第一个元素为参考基准,设定、动两个指针,发生交换后指针交换位置,直到指针重合。重复直到排序完成。
·快速排序是非就地的不稳定排序。时间复杂度为O(nlog2n),比较次数为n(n-1)/2;
选择排序:·直接选择排序: ·选择最小的放在比较区前。
·直接选择排序就地的不稳定排序。时间复杂度为O(n^2)。比较次数为n(n-1)/2;
·堆排序 ·建堆:按层次将数据填入完全二叉树,从int(n/2)处向前逐个调整位置。
·然后将树根与最后一个叶子交换值并断开与树的连接并重建堆,直到全断开。
·堆排序是就地不稳定的排序,时间复杂度为O(nlog2n),不适宜于记录数较少的文件。。
归并排序: ·先两个一组排序,形成(n+1)/2组,再将两组并一组,直到剩下一组为止。
·归并排序是非就地稳定排序,时间复杂度是O(nlog2n),
分配排序:·箱排序: ·按关键字的取值范围确定箱子数,按关键字投入箱子,链接所有非空箱。
·箱排序的平均时间复杂度是线性的O(n).
·基数排序:·从低位到高位依次对关键字进行箱排序。
·基数排序是非就稳定的排序,时间复杂度是O(d*n+d*rd)。
各种排序方法的比较和选择: ·.待排序的记录数目n;n较大的要用时间复杂度为O(nlog2n)的排序方法;
·记录的大小(规模);记录大最好用链表作为存储结构,而快速排序和堆排序在链表上难于实现;
·关键字的结构及其初始状态;
·对稳定性的要求;
·语言工具的条件;
·存储结构;
·时间和辅助空间复杂度。
lishixinzhi/Article/program/sjjg/201311/23750
数据结构-第八章学习小结
第八章的内容是排序,看上去很简单,实际上它有很多不同的分类。我觉得全章最难的部分就是算法的理解和时间效率(分最好情况和最坏情况)的分析上。
首先排序整体上可以分成两类:内部排序和外部排序。顾名思义,内部排序就是在内存中完成排序,外部排序就是在内存之外借助外存空间进行排序(数据量足够大的时候)。之前学过的B树和B+树就属于外部排序。而部排序又可以下分插入/交换/选择/归并/基数这五种。以下是对前四种排序方法各自的分类及其方法、效率、特点进行的总结:
从算法理解的角度上说,最难理解的应该就是快速排序了。主要是它用了递归,弄清楚每次的过程之后就好理解了。有用到递归的算法的空间复杂度就很好理解,因为在递归的过程中开辟了新的空间。
从算法效率上说,这几种排序方法是按一定的顺序排列的。如折半插入排序在直接插入排序的基础上进行改进,用二分法查找该插入的位置,减少了比较的次数;希尔排序和折半插入排序同样适合记录无序、n较大的情况,但时间效率随增量的变化而变化,同时也是种不稳定的排序方法;快速排序是基于冒泡排序而提出的,解决了冒泡不能对记录无序、n较大情况排序的缺点,但它又是一种不稳定的算法;树型选择排序的提出解决了简单选择排序的不稳定性,但有很多多余的比较次数,所占的辅助空间也比较多,这点由堆排序进行改良,辅助空间少了,但又变成了不稳定的排序方法。
在做作业题的过程中发现客观题对这些排序的具体实现过程和时间效率的考察较多,而且当时做的时候感觉所有排序方法都混淆了...现在再整理一遍感觉思路清晰多了,但时间间隔有点长,快速排序和堆排序得再看看课堂录播视频才行。
总的来说在这一章的学习里面比较被动,刚开始想着排序会比较简单,看书的时候没怎么细看代码,听课时就发现有点难理解了。最重要的应该还是每种排序的具体实现,记住了这个,时间效率和空间效率都能推出来。(目前记不熟的就是快速排序和堆排序这两个最难的)看来得再加把劲了。
以上是关于数据结构复习总结第八章排序的主要内容,如果未能解决你的问题,请参考以下文章