1.介绍一下你熟悉的几种排序算法以及它们的时间复杂度
①冒泡排序
- 它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换。
- 算法的平均时间复杂度为O(n^2)。
- 但是若在某趟排序中未发现气泡位置的交换,则说明待排序的无序区中所有气泡均满足轻者在上,重者在下的原则,即为正序。则冒泡排序过程可在此趟扫描后就终止,基于这种考虑,提出了第一种改进的算法。
public static void bubbleSort(int[] numbers) { int size = numbers.length; boolean isSorted = false; for (int i = 0; i < size - 1 && !isSorted; i++) { isSorted = true; for (int j = 0; j < size - 1 - i; j++) { if (numbers[j] > numbers[j + 1]) { swap(numbers, j, j + 1); isSorted = false; } } } }
②快速排序
- 快速排序是一种排序算法,对包含n个数的输入数组,平均时间为O(nlgn),最坏情况是O(n^2)。
- 快速排序时基于分治模式处理的,在数据集之中,选择一个元素作为”基准”(pivot),所有小于”基准”的元素,都移到”基准”的左边;所有大于”基准”的元素,都移到”基准”的右边。这个操作称为分区 (partition) 操作,分区操作结束后,基准元素所处的位置就是最终排序后它的位置。对”基准”左边和右边的两个子集,不断重复第一步和第二步,直到所有子集只剩下一个元素为止。
- 快排的局限性:快排是一个效率很高的排序算法,但是对于长度很小的序列,快排效率低;pivot选择不当,将导致树的不平衡,这样导致快排的时间复杂度为o(n^2);当数组中有大量重复的元素,快排效率将非常之低;改进方法可以参考java.util.DualPivotQuicksort:小数组使用插入排序、双枢轴(快速三向切分)、划分策略优化(五取样划分)。
public static void quick(int[] numbers) { if (numbers.length > 0) { quickSort(numbers, 0, numbers.length - 1); } } public static void quickSort(int[] numbers, int low, int high) { if (low < high) { int middle = getMiddle(numbers, low, high); //将numbers数组进行一分为二 quickSort(numbers, low, middle - 1); //对低字段表进行递归排序 quickSort(numbers, middle + 1, high); //对高字段表进行递归排序 } } public static int getMiddle(int[] numbers, int low, int high) { int temp = numbers[low]; //数组的第一个作为中轴 while (low < high) { while (low < high && numbers[high] > temp) { high--; } numbers[low] = numbers[high];//比中轴小的记录移到低端 while (low < high && numbers[low] < temp) { low++; } numbers[high] = numbers[low]; //比中轴大的记录移到高端 } numbers[low] = temp; //中轴记录到尾 return low; // 返回中轴的位置 }
③堆排序
- 堆(二叉堆)可以视为一棵完全的二叉树,完全二叉树的一个“优秀”的性质是,除了最底层之外,每一层都是满的,这使得堆可以利用数组来表示(普通的一般的二叉树通常用链表作为基本容器表示),每一个结点对应数组中的一个元素。
- 二叉堆一般分为两种:最大堆和最小堆。最大堆:最大堆中的最大元素值出现在根结点(堆顶);堆中每个父节点的元素值都大于等于其孩子结点(如果存在);
- 堆排序就是把最大堆堆顶的最大数取出,将剩余的堆继续调整为最大堆,再次将堆顶的最大数取出,这个过程持续到剩余数只有一个时结束。在堆中定义以下几种操作:
最大堆调整(Max-Heapify):将堆的末端子节点作调整,使得子节点永远小于父节点 创建最大堆(Build-Max-Heap):将堆所有数据重新排序,使其成为最大堆 堆排序(Heap-Sort):移除位在第一个数据的根节点,并做最大堆调整的递归运算 Parent(i) = floor((i-1)/2),i 的父节点下标 Left(i) = 2i + 1,i 的左子节点下标 Right(i) = 2(i + 1),i 的右子节点下标
- 堆排序其实也是一种选择排序,是一种树形选择排序。只不过直接选择排序中,为了从R[1…n]中选择最大记录,需比较n-1次,然后从R[1…n-2]中选择最大记录需比较n-2次。事实上这n-2次比较中有很多已经在前面的n-1次比较中已经做过,而树形选择排序恰好利用树形的特点保存了部分前面的比较结果,因此可以减少比较次数。对于n个关键字序列,最坏情况下每个节点需比较log2(n)次,因此其最坏情况下时间复杂度为nlogn。堆排序为不稳定排序,不适合记录较少的排序。