一文彻底掌握时间复杂度和大O表示法(整理)
Posted 渔夫数据库笔记
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一文彻底掌握时间复杂度和大O表示法(整理)相关的知识,希望对你有一定的参考价值。
预备知识:
计算机基础知识
高中数学知识
时间复杂度用来干嘛
时间复杂度是衡量算法好坏的一个重要指标,另一个重要指标是空间复杂度。
算法
我们先来了解一下算法,对于一个计算机程序,其算法就是其内部执行的各种逻辑的执行步骤。
算法既然是计算机上的程序的逻辑执行步骤,那他运行的过程中,必须是需要占用计算机的cpu和存储空间。其中使用cpu计算的总次数的数量级,就以时间复杂度来标识(因为往往运算的次数和时间是成正比的,次数多,使用的时间就多),符号为大写O。
时间复杂度的定义
一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数(算法中操作执行次数函数),用T(n)表示。
若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n))为算法的渐进时间复杂度(O是数量级的符号 ),简称时间复杂度。
上面这一句我用大白话翻译一下:因为操作执行次数函数,往往含有较多的项,为了让时间复杂度更清晰明了的标识算法好坏,需要找到一个很简单的同数量级函数来替代。例如:
假设一个算法的执行次数计算公式如下
T(n) = 2 + 4n + 3n*log2n
可以找到一个函数
f(n) = n*log2n
得到
lim(T(n)/f(n)) = (2+4n+3n*log2n) / (n*log2n)
= 2*(1/n)*(1/log2n) + 4*(1/log2n) + 3
当n趋向于无穷大,1/n趋向于0,1/log2n趋向于0,所以极限等于3。上面的lim就是极限的意思
基本的计算步骤
计算出基本操作的执行次数T(n)
基本操作即算法中的每条语句,语句的执行次数也叫做语句的频度。
计算出T(n)的数量级 ( 即找到辅助函数f(n) )
求T(n)的数量级,只要将T(n)进行如下一些操作:
忽略常量(常量可以看做0次幂,但是如果只有常量情况就变成了特殊的O(1),后面有讲)
忽略低次幂
忽略最高次幂的系数(如果最高次存在)
令f(n)=T(n)的数量级。
用大O来表示时间复杂度
当n趋近于无穷大时,如果lim(T(n)/f(n))的值为不等于0的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n))。
实例说明
int n;
int num1, num2;
for(int i=0; i<n; i++)
num1 += 1;
for(int j=1; j<=n; j*=2)
num2 += num1;
按照上面的步骤分析:
1.计算出基本操作的执行次数T(n)
语句int n;的频度为1;
语句int num1, num2;的频度为1;
语句i=0;的频度为1;
语句i<n; i++; num1+=1; j=1; 的频度为n;
语句j<=n; j*=2; num2+=num1;的频度为n*log2n;
T(n) = 3 + 4n + 3n*log2n
2.计算出T(n)的数量级 ( 即找到辅助函数f(n) )
忽略掉T(n)中的常量、低次幂和最高次幂的系数
f(n) = n*log2n
3.用大O来表示
lim(T(n)/f(n)) = (3+4n+3n*log2n) / (n*log2n)
= 3*(1/n)*(1/log2n) + 4*(1/log2n) + 3
当n趋向于无穷大,1/n趋向于0,1/log2n趋向于0
所以极限等于3。
T(n) = O(n*log2n)
特殊的O(1)
在大O表示法里面有一个特例,如果T(n) = c, c是一个与n无关的任意非零常数,时间复杂度记为O(1)。推导过程我们就不讲了。
题外话:
频度和时间的不绝对关联
这期间需要一些数学知识来进行公式变换和函数计算,并且,这里的频度,代表的是一种次数,而不是计算时间。
这是因为一个语句的执行,实际会被翻译成多条计算机指令,在不同的编辑器和不同的机器上都可能有不同的表现(比如乘法指令可能被翻译为计算机的加法,除法指令可能被翻译为位移操作等)。所以一般来说时间复杂度都是概略的估计,而不是一种精确地表示。
n需要无穷大
算法的优异在n比较小的时候可能没有太大差异,甚至优秀的算法,有可能在n比较小的时候,计算次数会更多。这个时候算法的优劣带来的问题并不明显,一般没有太大讨论的意义。
一个数量级大小判断经验
复杂度与时间效率的关系:
c < log2n < n < n*log2n < n^2 < n^3 < 2^n < 3^n < n! (c是一个常量)
|--------------------------|--------------------------|-------------|
较好 一般 较差
其中c是一个常量,如果一个算法的复杂度为c 、 log2n 、n 、 n*log2n,那么这个算法时间效率比较高
如果是 2^n , 3^n ,n!,算法效率就比较低(当然也会有一些没有办法优化的代码)
中间的几个效率尚可。
--------------------------------------------------------------------------------
一些补充说明
最坏时间复杂度
算法的时间复杂度不仅与语句频度有关,还与问题规模及输入实例中各元素的取值有关。一般不特别说明,讨论的时间复杂度均是最坏情况下的时间复杂度。这就保证了算法的运行时间不会比任何更长。
求数量级
即求对数值(log),默认底数为10,简单来说就是“一个数用标准科学计数法表示后,10的指数”。例如,5000=5x10 3 (log5000=3) ,数量级为3。另外,一个未知数的数量级为其最接近的数量级,即最大可能的数量级。
求极限的技巧
要利用好1/n。当n趋于无穷大时,1/n趋向于0
--------------------------------------------------------------------------------
一些规则(引自:时间复杂度计算 )
1) 加法规则
T(n,m) = T1(n) + T2(n) = O (max ( f(n), g(m) )
2) 乘法规则
T(n,m) = T1(n) * T2(m) = O (f(n) * g(m))
3) 一个特例(问题规模为常量的时间复杂度)
在大O表示法里面有一个特例,如果T1(n) = O(c), c是一个与n无关的任意常数,T2(n) = O ( f(n) ) 则有
T(n) = T1(n) * T2(n) = O ( c*f(n) ) = O( f(n) )
也就是说,在大O表示法中,任何非0正常数都属于同一数量级,记为O(1)。
4) 一个经验规则
复杂度与时间效率的关系:
c < log2n < n < n*log2n < n2 < n3 < 2n < 3n < n! (c是一个常量)
|--------------------------|--------------------------|-------------|
较好 一般 较差
其中c是一个常量,如果一个算法的复杂度为c 、 log2n 、n 、 n*log2n,那么这个算法时间效率比较高 ,如果是 2n , 3n ,n!,那么稍微大一些的n就会令这个算法不能动了,居于中间的几个则差强人意。
--------------------------------------------------------------------------------------------------
复杂情况的分析
以上都是对于单个嵌套循环的情况进行分析,但实际上还可能有其他的情况,下面将例举说明。
1.并列循环的复杂度分析
将各个嵌套循环的时间复杂度相加。
例如:
for (i=1; i<=n; i++)
x++;
for (i=1; i<=n; i++)
for (j=1; j<=n; j++)
x++;
解:
第一个for循环
T(n) = n
f(n) = n
时间复杂度为Ο(n)
第二个for循环
T(n) = n2
f(n) = n2
时间复杂度为Ο(n2)
整个算法的时间复杂度为Ο(n+n2) = Ο(n2)。
2.函数调用的复杂度分析
例如:
public void printsum(int count)
int sum = 1;
for(int i= 0; i<n; i++)
sum += i;
System.out.print(sum);
分析:
记住,只有可运行的语句才会增加时间复杂度,因此,上面方法里的内容除了循环之外,其余的可运行语句的复杂度都是O(1)。
所以printsum的时间复杂度 = for的O(n)+O(1) = 忽略常量 = O(n)
*这里其实可以运用公式 num = n*(n+1)/2,对算法进行优化,改为:
public void printsum(int count)
int sum = 1;
sum = count * (count+1)/2;
System.out.print(sum);
这样算法的时间复杂度将由原来的O(n)降为O(1),大大地提高了算法的性能。
3.混合情况(多个方法调用与循环)的复杂度分析
例如:
public void suixiangMethod(int n)
printsum(n);//1.1
for(int i= 0; i<n; i++)
printsum(n); //1.2
for(int i= 0; i<n; i++)
for(int k=0; k
System.out.print(i,k); //1.3
suixiangMethod 方法的时间复杂度需要计算方法体的各个成员的复杂度。
也就是1.1+1.2+1.3 = O(1)+O(n)+O(n2) ----> 忽略常数 和 非主要项 == O(n2)
--------------------------------------------------------------------------------------------------
更多的例子
O(1)
交换i和j的内容
temp=i;
i=j;
j=temp;
以上三条单个语句的频度为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间复杂度为常数阶,记作T(n)=O(1)。如果算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。此类算法的时间复杂度是O(1)。
O(n2)
sum=0; /* 执行次数1 */
for(i=1;i<=n;i++)
for(j=1;j<=n;j++)
sum++; /* 执行次数n2 */
解:T(n) = 1 + n2 = O(n2)
for (i=1;i<n;i++)
y=y+1; ①
for (j=0;j<=(2*n);j++)
x++; ②
解: 语句1的频度是n-1
语句2的频度是(n-1)*(2n+1) = 2n2-n-1
T(n) = 2n2-n-1+(n-1) = 2n2-2
f(n) = n2
lim(T(n)/f(n)) = 2 + 2*(1/n2) = 2
T(n) = O(n2).
O(n)
a=0;
b=1; ①
for (i=1;i<=n;i++) ②
s=a+b; ③
b=a; ④
a=s; ⑤
解: 语句1的频度:2,
语句2的频度:n,
语句3的频度:n,
语句4的频度:n,
语句5的频度:n,
T(n) = 2+4n
f(n) = n
lim(T(n)/f(n)) = 2*(1/n) + 4 = 4
T(n) = O(n).
O(log2n)
i=1; ①
while (i<=n)
i=i*2; ②
解: 语句1的频度是1,
设语句2的频度是t, 则:nt<=n; t<=log2n
考虑最坏情况,取最大值t=log2n,
T(n) = 1 + log2n
f(n) = log2n
lim(T(n)/f(n)) = 1/log2n + 1 = 1
T(n) = O(log2n)
O(n3)
for(i=0;i<n;i++)
for(j=0;j<i;j++)
for(k=0;k<j;k++)
x=x+2;
解:当i=m, j=k的时候,内层循环的次数为k当i=m时, j 可以取 0,1,...,m-1 , 所以这里最内循环共进行了0+1+...+m-1=(m-1)m/2次所以,i从0取到n, 则循环共进行了: 0+(1-1)*1/2+...+(n-1)n/2=n(n+1)(n-1)/2次
T(n) = n(n+1)(n-1)/2 = (n3-n)/2
f(n) = n3
所以时间复杂度为O(n3)。
以上是关于一文彻底掌握时间复杂度和大O表示法(整理)的主要内容,如果未能解决你的问题,请参考以下文章
JVM关于JVM,你需要掌握这些 | 一文彻底吃透JVM系列