C++算法恢复训练之时间复杂度
Posted Claude的羽毛
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++算法恢复训练之时间复杂度相关的知识,希望对你有一定的参考价值。
时间复杂度是算法分析中用于衡量算法运行时间的指标。它表示算法运行所需时间与输入规模之间的关系。通常用大O符号来表示算法的时间复杂度,例如 O ( n ) O(n) O(n)、 O ( n 2 ) O(n^2) O(n2)等。
文章目录
一、时间复杂度的表示方法
如果一个算法的时间复杂度是 O ( f ( n ) ) O(f(n)) O(f(n)),那么当输入规模为 n n n时,该算法的运行时间最多是 f ( n ) f(n) f(n)的某个常数倍,即存在正常数 c c c和 n 0 n_0 n0,使得当 n > = n 0 n>=n_0 n>=n0时,算法的运行时间不超过 c ∗ f ( n ) c*f(n) c∗f(n)。
常见的时间复杂度包括:
- 常数时间复杂度 O ( 1 ) O(1) O(1),表示算法的运行时间与输入规模无关;
- 线性时间复杂度 O ( n ) O(n) O(n),表示算法的运行时间与输入规模成线性关系;
- 对数时间复杂度 O ( l o g n ) O(log n) O(logn),表示算法的运行时间与输入规模的对数成正比;
- 平方时间复杂度 O ( n 2 ) O(n^2) O(n2),表示算法的运行时间与输入规模的平方成正比;
- 指数时间复杂度 O ( 2 n ) O(2^n) O(2n),表示算法的运行时间与输入规模的指数成正比。
在实际应用中,我们通常希望算法的时间复杂度越小越好,因为这意味着算法的运行时间更短,更高效。但是,在设计算法时,我们还需要综合考虑其他因素,如空间复杂度、可读性、可维护性等。
二、那么如何去计算算法的时间复杂度?
计算算法的时间复杂度需要分析算法的每个操作在最坏情况下的执行次数,并将这些执行次数相加得到总的时间复杂度。
算法复杂度本质上是一个算法开发人员互相之间交流和评价用的工具,其核心不在于将所有的指令执行次数统计出来。算法复杂度可以视作常数操作的倍数(常数操作,即前文提到的 O ( 1 ) O(1) O(1),可以看作是程序算法执行的最小可统计单元),借助数学中多项式的概念,算法复杂度可以用下面表达式来表示:
f ( x ) = a 0 + a 1 x + a 2 x 2 + ⋯ + a n x n f(x) = a_0 +a_1 x+a_2 x^2+⋯+a_n x^n f(x)=a0+a1x+a2x2+⋯+anxn
诚然,通过分析工具确实可以统计某个常数操作在某次运行过程中的执行次数,但是算法复杂度的意义并不在此。算法工程师们希望用一个更加通用的描述来赋予自己的创作。所以我们也可以看到并没有人会用完整的多项式来“精确”描述自己算法的复杂度,约定的做法是:去除低阶项和常数项,省略高阶项的非零常数系数。
此外,在具体的算法分析时也会遇到一些特定的情况。下面介绍两种常见情况的处理方法。
- 最坏时间复杂度分析法
最坏时间复杂度是指算法在最坏情况下所需的时间。在分析算法时间复杂度时,通常采用最坏时间复杂度分析法。
具体步骤为:
- 找出算法中时间复杂度最高的那条语句;
- 确定语句执行的次数和输入规模的关系;
- 忽略常数项和低次幂项,得到最高次幂的项。
- 例如,下面是一个计算n个元素的数组中最大值的算法:
max = a[0];
for (i = 1; i < n; i++)
if (a[i] > max)
max = a[i];
在该算法中,最耗时的操作是比较大小的if
语句。该语句在最坏情况下会执行n-1次,因此该算法的时间复杂度为
O
(
n
)
O(n)
O(n)。
- 平均时间复杂度分析法
平均时间复杂度是指算法在平均情况下所需的时间。对于一些特殊的算法,如随机算法,采用平均时间复杂度分析法更为合适。
具体步骤为:
- 分析算法中每个操作在所有可能的输入中执行的次数;
- 对每个操作的执行次数进行加权平均,得到平均执行次数;
- 忽略常数项和低次幂项,得到最高次幂的项。
需要注意的是,平均时间复杂度的分析比较复杂,通常需要对算法的输入做出一些假设,如元素是均匀分布的等。
总之,计算算法的时间复杂度需要对算法的每个操作进行分析,并将所有操作的执行次数相加得到总的时间复杂度。计算时间复杂度不仅有助于评估算法的效率,还有助于我们更好地理解和优化算法。
三、简单算法和算法复杂度的计算
课题需求:已知有 有序数组A(大小为n),无序数组B(大小为m),找出B中所有不在A中的数。
- 算法设计1:遍历B中的数,并在A中也通过遍历去判断是否在A中出现;
- 算法设计2:遍历B中的数,并在A中通过二分查找的方式判断是否在A中出现;
- 算法设计3:利用哈希表遍历存储A的所有数,再遍历B中的数,检查哈希表中是否含有该数。
对于算法1,比较容易得出:这个比对的过程需要经历 m ∗ n m*n m∗n次,所以其算法复杂度为 O ( m ∗ n ) O(m*n) O(m∗n)。
对于算法2,二分查找的算法复杂度为 O ( l o g 2 ( n ) ) O(log_2(n)) O(log2(n))(对于长度为n的数组,不断得除以2,需要 l o g 2 ( n ) log_2(n) log2(n)次才能除尽),相当于B里的每个数都要经历 l o g 2 ( n ) log_2(n) log2(n)次才能得出其匹配结果(最坏情况下,对应前面提到的算法计算方法的最坏时间复杂度分析法),所以共计 m ∗ l o g 2 ( n ) m* log_2(n) m∗log2(n),算法复杂度即为 O ( m ∗ l o g 2 ( n ) ) O(m* log_2(n)) O(m∗log2(n))。
对于算法3,因为本身哈希表的查找效率极高,可以看作是常数操作 O ( 1 ) O(1) O(1),所以实际上的执行次数主要是两次遍历,即最后的算法复杂度为 O ( m + n ) O(m+n) O(m+n)。当然这里利用了辅助哈希表,算是额外的空间开销,需要计入空间复杂度的计算。
总结
当涉及到算法设计时,我们需要考虑两个方面:时间复杂度和空间复杂度。
时间复杂度是指算法解决问题所需的时间,即执行算法的指令次数。通常用大O记法表示,可以帮助我们快速了解算法的时间复杂度和问题规模之间的关系。
空间复杂度是指算法解决问题所需的内存空间,即算法运行时占用的内存空间大小。通常用大O记法表示,可以帮助我们快速了解算法的空间复杂度和问题规模之间的关系。
在算法设计中,我们需要在满足问题需求的前提下,尽可能地提高算法的效率,即使得算法的时间复杂度和空间复杂度都尽可能地低。
在分析算法复杂度时,我们需要了解不同算法的复杂度级别,这样可以帮助我们快速判断算法的效率。一般而言,复杂度级别越低,算法效率越高。
最后,算法复杂度是算法设计中非常重要的概念,对于编写高效、快速的算法具有重要意义。在实际应用中,我们需要根据具体问题和应用场景来选择不同的算法,以提高算法的效率和性能。
极客算法训练笔记,十大经典排序之冒泡,选择,插入排序
目录
排序算法衡量指标
冒泡排序
选择排序
插入排序
排序算法衡量指标
关于排序算法的重要性我就不啰嗦了,不重要你也遇不到这篇文章。安利一个学习算法免费看动画的网站,该文的动图都来自这个网站 https://visualgo.net/zh/sorting ,感谢站长。
那么多的经典和野鸡排序算法,讲之前我们先关注一下排序算法的衡量指标:
-
时间复杂度
-
空间复杂度
-
最好情况
-
最坏情况
-
比较次数,交换次数
-
稳定性
脱离了实际运用的数据结构是没有意义的,真正软件开发中,我们要排序的往往不是单纯的整数,而是一组对象,我们需要按照对象 的某个key来排序。
比如说,我们现在要给电商交易系统中的“订单”排序。订单有两个属性,一个是下单时间,另一个是订单金额。如果我们现在有10万条订单数据,我们希望按照金额从小到大对订单数据排序。对于金额相同的订单,我们希望按照下单时间从早到晚有序。对于这样一个排序需求,我们怎么来做呢?
-
直接思路:我们先按照金额对订单数据进行排序,然后,再遍历排序之后的订单数据,对于每个金额相同的小区间再按照下单时间排序。这种排序思路理解起来不难,但是实现起来会很复杂。
-
稳定排序算法思路:这个问题可以非常简洁地解决,我们先按照下单时间给订单排序,注意是按照下单时间,不是金额。排序完成之后,我们用稳定排序算法,按照订单金额重新排序。两遍排序之后,我们得到的订单数据就是按照金额从小到大排序,金额相同的订单按照下单时间从早到晚排序的。
-
为什么呢?稳定排序算法可以保持金额相同的两个对象,在排序之后的前后顺序不变。第一次排序之后,所有的订单按照下单时间从早到晚有序了。在第二次排序中,我们用的是稳定的排序算法,所以经过第二次排序之后,相同金额的订单仍然保持下单时间从早到晚有序。
-
稳定性解释:比如我们有一组数据2,9,3,4,8,3,按照大小排序之后就是2,3,3,4,8,9。这组数据里有两个3。经过某种排序算法排序之后,如果两个3的前后顺序没有改变,那我们就把这种排序算法叫作稳定的排序算法;如果前后顺序发生变化,那对应的排序算法就叫作不稳定的排序算法。
-
为什么要关注稳定性?
-
是否原地(原址,就地)排序
维基百科说的原地排序就是指在排序过程中不申请多余的存储空间,只利用原来存储待排数据的存储空间进行比较和交换的数据排序。简单理解为,允许借助几个变量,不需要额外开数组。
属于原地排序的是:希尔排序、冒泡排序、插入排序、选择排序、堆排序、快速排序,他们都会有一项比较且交换操作(swap(i,j))的逻辑在其中;而合并排序,计数排序,基数排序等不是原地排序。
-
十大经典排序算法江山图
排序方式In-Place指的是原地排序,Out-place指的非原地排序
看了江山图之后,我们先来看江山图里混成了最底层的弟弟们,冒泡排序,选择排序和插入排序,这几个是时间复杂度最高的排序。
冒泡排序
这个排序不简单,大学里面每个学校都必教的一个排序
-
算法描述
给定一个N个元素的数组,冒泡法排序将:
-
比较一对相邻元素(a,b); -
如果元素大小关系不正确,交换这两个数; -
重复步骤1和2,直到我们到达数组的末尾(最后一对是第(N-2)和(N-1)项,因为我们的数组从零开始) -
第一次循环比较结束,最大的元素将在最后的位置。然后我们将N减少1,并重复步骤1,直到N = 1。
-
算法思想
一次冒泡会让至少一个元素移动到它应该在的位置,重复n次,就完成了n个数据的排序工作。
交换旗帜变量 = 假 (False)
从 i = 1 到 最后一个没有排序过元素的指数
如果 左边元素 > 右边元素
交换(左边元素,右边元素)
交换旗帜变量 = 真(True)
while 交换旗帜变量 -
动图演示
-
动图解释,后面所有的动图颜色代表的意思一样
-
黄色的条代表已经排好序的元素;
-
绿色的代表此算法正在操作,进行比较交换的元素
-
蓝色代表还没有排序的
-
代码实现
public class BubbleSort {
public static int[] bubbleSort(int[] arr) {
if (arr == null || arr.length < 2) {
return arr;
}
int n = arr.length;
// 第一层循环,每循环一次,排好一个元素,在最右边
for (int i = 0; i < n; i++) {
// 第二层循环,到右边第一个没有排序过元素地方结束,进行比较交换
for (int j = 0; j < n -i - 1; j++) {
// 比较,大于小于号决定是按照从大到小排还是从小到大排
if (arr[j + 1] < arr[j]) {
// 交换
int t = arr[j];
arr[j] = arr[j+1];
arr[j+1] = t;
}
}
}
return arr;
}
)
可知第二层循环是进行比较交换
的核心逻辑,第一层循环用来确定排好了几个元素,决定了第二层循环的比较次数,n-i-1之所以减去一,是因为比如剩下10个元素没有排序,10个元素只有9对,需要比较九次。
-
稳定性分析
稳定。只有交换才可以改变两个元素的前后顺序,当有相邻的两个元素大小相等的时候,我们不做交换,相同大小的数据在排序前后不会改变顺序,所以冒泡排序是稳定的排序算法。如果代码交换逻辑改成
if (arr[j + 1] <= arr[j]),加了个=,那么就不稳定了。
-
时间复杂度分析
-
最好情况下,要排序的数据已经是有序的了,我们只需要进行一次冒泡操作,就可以结束了,所以最好情况时间复杂度是O(n)。
-
而最坏的情况是,要排序的数据刚好是倒序排列的,我们需要进行n次冒泡操作,所以最坏情况时间复杂度为O(n2)。
关于最好情况下只需要冒泡一次,我们可以将这个冒泡算法优化一下来更加直观的看到,
优化的根据:
假如从开始的第一对到结尾的最后一对,相邻的元素之间都没有发生交换的操作,这意味着右边的元素总是大于等于左边的元素,此时的数组已经是有序的了,我们无需再对剩余的元素重复比较下去了。代码如下:public void bubbleSort(int[] a, int n) {
for (int i = 0; i < n; ++i) {
// 提前退出冒泡循环的标志位
boolean flag = false;
for (int j = 0; j < n - i - 1; ++j) {
if (a[j] > a[j+1]) {
// 交换
int tmp = a[j];
a[j] = a[j+1];
a[j+1] = tmp;
}}
// 表示有数据交换
flag = true;
}}if (!flag) break; // 没有数据交换,提前退出直接能看到,最好情况就是n次比较。
选择排序
-
算法描述
给定 N 个项目和 L = 0 的数组,选择排序将:
-
在 [L ... N-1] 范围内找出最小项目 X 的位置, -
用第 L 项交换X, -
将下限 L 增加1并重复步骤1直到 L = N-2。 -
算法思想
选择排序分已排序区间和未排序区间,其实就是从头遍历,要排第几个元素,每次从剩余未排序元素里面找最小的元素,交换位置。
重复(元素个数-1)次
把第一个没有排序过的元素设置为最小值
遍历每个没有排序过的元素
如果元素 < 现在的最小值
将此元素设置成为新的最小值
将最小值和第一个没有排序过的位置交换 -
动图演示
红色表示当前遍历到的最小值。其他三个颜色和上面一样。
-
代码实现
public class SelectSort {
public static int[] selectSort(int[] a) {
int n = a.length;
// 从头开始遍历,选定某个元素待排序
for (int i = 0; i < n - 1; i++) {
// 将这个元素设为最小值
int min = i;
// 遍历所有未排过序的元素,从第i个元素右边开始
for (int j = i + 1; j < n; j++) {
// 如果元素小于当前最小值,那么最小值改为当前值
if(a[min] > a[j])
min = j;
}
// 以上得到了当前最小值,将当前最小值提到前面
//交换
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
return a;
}
}
-
稳定性分析
不稳定。从动画当中可以看出,选择排序每次都要找剩余未排序元素中的最小值,并和前面的元素交换位置,这样破坏了稳定性。
如果你还是难以理解,那么举个栗子,比如4,6,4,2,7这样一组数据,使用选择排序算法来排序的话,第一次找到最小元素2,与第一个5交换位置,那第一个4和中间的4顺序就变了,所以就不稳定 了。正是因此,相对于冒泡排序和插入排序,选择排序就稍微逊色了。
-
时间复杂度分析
最好和最坏情况都是n的平方,因为每次都是去查寻最小的元素,第二层的遍历无论如何也要做,避免不了,因此选择排序可谓是弟中弟。
插入排序
-
算法描述
插入排序类似于大多数人安排扑克牌的方式。
-
从你手中的一张牌开始, -
选择下一张卡并将其插入到正确的排序顺序中, -
对所有的卡重复上一步。 -
算法思想
插入排序和选择排序一样,都分已排序区和位排序区。
将第一个元素标记为已排序
遍历每个没有排序过的元素
“提取” 元素 X
i = 最后排序过元素的指数 到 0 的遍历
如果现在排序过的元素 > 提取的元素
将排序过的元素向右移一格
否则:插入提取的元素 -
动图演示
红色代表选中的需要排序的。
-
代码实现
public class InsertSort {
public static int[] insertSort(int[] arr) {
if(arr == null || arr.length < 2)
return arr;
int n = arr.length;
// 下标为0的数默认是有序的,从下标为1的数开始遍历,将其放入他该去的地方
for (int i = 1; i < n; i++) {
// 申请一个变量记录要插入的数据,也就是动图中红色的元素
int tmp = arr[i];
// 从已经排序的序列最右边的开始比较,找到比其小的数,即动图中绿色的元素序号
int j = i;
// 红色元素下标大于0,要插入元素与遍历到的元素满足大小关系,遍历到的元素往后挪位腾位置 // 继续遍历,直到不满足大小关系停止,这个地方就是它的位置
// 即红色元素小于绿色元素时,绿色元素挪位
while (j > 0 && tmp < arr[j - 1]) {
// 绿色元素往后挪一位
arr[j] = arr[j - 1];
j--;
}
// 存在比其小的数,插入
if (j != i) {
arr[j] = tmp;
}
}
return arr;
}
} -
稳定性分析
稳定。在插入排序中,对于值相同的元素,我们可以选择将后面出现的元素,插入到前面出现元素的后面,这样就可以保持原有的前后顺序不变,所以插入排序是稳定的排序算法。
-
时间复杂度分析
如果要排序的数据已经是有序的,我们并不需要搬移任何数据。如果我们从尾到头在有序数据组里面查找插入位置,每次只需要比较一个数据就能确定插入的位置。所以这种情况下,最好是时间复杂度为O(n)。注意,这里是从尾到头遍历已经有序的数据。
如果数组是倒序的,每次插入都相当于在数组的第一个位置插入新的数据,所以需要移动大量的数据,所以最坏情况时间复杂度为O(n2)。
下一篇写希尔,归并,快排和堆排序,还是按照这种格式,有收获的三连走起,欢迎关注我,我是小魔女阿甘,扫码有惊喜哦。
以上是关于C++算法恢复训练之时间复杂度的主要内容,如果未能解决你的问题,请参考以下文章