扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析
Posted 忘记背后,努力面前;心定大志,壮马驰驱。
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析相关的知识,希望对你有一定的参考价值。
1、复杂度分析
复杂度分析本身是非常理论化的一个内容,在计算机科学中,有一个专门的学科叫做——计算复杂性理论。
很多童鞋看过《算法导论》,这本书的内容很多很强调算法导论。
但是实际上,对于普通程序员来说,不需要过度强调理论化的内容。因为工作中更多面对的是实际的
软件工程,工程化的工作不需要面对太多理论性的东东。
2、复杂度分析
复杂度分析的作用:是为了表示算法的性能。
对于同样一个任务,可能有多个实现方式,即多个算法。这些不同的算法,它们的时间性能是否有差异呢?
我们虽然可以用一个测试用例,或者一组测试用例实际比较性能差异。
但是,这样的比较结果有局限性。
比如,需要保证运行不同算法的计算机硬件设备的性能一致,甚至深入的说,他们的OS当时的状态都需要是一致的。
这本身很难保证,而且测试结果也与我们的测试用例设计和用例输入相关。
而且,最重要的是这样比较是事后的。
如何突破局限性,如何事前比较呢?
种种这样的需求,都需要我们有一套工具,从数学的层面,用抽象的方式,判断一个算法的性能是怎样的?
为了回应这样的需求,就产生了复杂度分析这样一个概念。
3、复杂度分析和算法性能的关系
复杂度分析,如何表示算法的性能呢?
需要注意的是,算法复杂度分析通常考虑最坏的情况。
这样的思想非常普遍,比如上班时,为了不迟到,考虑最长需要多少时间,甚至将堵车的时间都考虑进去。
即,复杂度分析,表示的是算法运行的上界。
对于我们的线性查找法代码,我们来进行一个复杂度分析吧,代码再一次贴出来:
public static <E> int search(E [] data,E target)
for (int i = 0; i < data.length; i++)
if (data[i].equals(target))
return i;
return -1;
具体的分析过程如下:
n = data.length
T 表示时间
T和n的关系到底是怎样的?
T = n?n个元素全部扫描了一遍? 就是n?
T = 2n?if里有比较、有返回结果这2步 就是2n?
T = 3n? 其实if中的data[i],要在数组data中找到i这个元素,是一步寻址,也需要算作一个子步骤。 3n了?
T = 4n?for循环中也包含每次要做的事情,i<data.length,也是一个判断操作,所以4n?
T = 5n?for循环中还有一个i++的操作,所以5n?
T = 5n+2? int i =0;加1次,return -1;加1次,所T=5n+2?
……
其实,再继续分析下去还可以分析出很多可能,就不继续分析了,为什么不继续了呢?
因为真的分析的话,拿出for循环对应的汇编代码,看看这个循环执行了多少指令?
可是拿出汇编代码也不够,因为汇编代码对应着机器指令,而机器指令不仅仅是代码有多少行而已,
还要追溯到运行代码的CPU架构上,有些复杂指令在有些CPU上,就一个指令,但在另外一些CPU上,可能就是多个指令。
对于上层应用软件开发者来说,分析清楚每一行高级语言代码对应着多少机器指令,是一件非常困难,甚至说不可能的事情,其实也没有必要。
而且即便T=5n+2,那这个等式的时间单位是多少呢?是毫秒ms嘛?肯定不对应时间,对应的是指令数,但是一条指令在cpu中执行多久我们知道嘛?
我们不知道。
所以,这些其实我们都不需要考虑,我们需要进行一个化简。这也是计算机科学家们定义复杂度分析这个概念时做过的事儿,没错,他们做了化简。
我们不需要知道执行这样一个循环,对这n个元素操作,每一次循环需要执行多少个指令;
我们只需要知道,整个算法和这个data数组的大小,和这个数据规模n成一个正比的关系即可。
4、O(n)
这个就记作O(n),表示的就是运行时间和数据规模n之间的一个正比关系。
进一步看,如果:
T = c1*n + c2
这个算法我们就可以记作O(n),即常数c1、c2都被我们忽略掉了,即算法复杂度的世界中,常数不重要。
5、复杂度描述的是什么?
复杂度描述的是:随着数据规模的增大,算法性能的变化趋势。
假设有2个算法,分别是T1和T2,它们的详细情况如下:
T1 = 10000n
T2 = 2n²
第一个算法 O(n)级别的算法,第二个算法O(n²)级别的算法。
从复杂度理论的角度来看,第一个算法优于第二个算法。
**因为总是会存在某一临界点n0,当n>n0,T1<T2。
可以计算出,这里的临界点n0为5000。
一旦数据规模大于5000,算法一的性能优势就体现出来了,而且n越大,体现的越明显。
所以O(n)描述的就是随着n的变化,算法的性能的变化趋势,
而不是说n取某个值时,算法的性能。
实际上,如果测试数据小于5000,比如为100时,第二个算法O(n²)反而优于第一个算法O(n);
但是评价算法性能,我们要看n逐渐上涨的情况,甚至看n无穷大的情况。
有了这套题解,再也不怕刷 LeetCode 了!
传智汇
传智播客旗下IT互联网精英社区
作为程序员立身之根本,算法是面试必不可少的环节。想进大厂?不懂数据结构和算法是不行滴!
这里有一张思维导图,总结了互联网公司面试中经常考察的问题类型,可供面试前参考。
如何提升自己的算法能力?有人会啃《算法导论》这样的经典书籍。对大部分人来说,在 LeetCode 上刷题是条捷径!Leetcode 是注重算法的刷题工具,在考算法的笔试面试中,碰见原题的概率非常大。关键是你可以看到其他人留下的思考过程和解题思路,比你啃死板的书籍更有收获。
Github上的这套题解,号称 “最全中文 LeetCode 解题攻略”,2020年4月中旬,项目已突破三万 Star 。
题解分为五部分:
第一个部分是 LeetCode 经典题目的解析,包括思路,关键点和具体的代码实现
第二部分是对于数据结构与算法的总结
第三部分是 anki 卡片, 将 LeetCode 题目按照一定的方式记录在 anki 中,方便大家记忆
第四部分是每日一题,大家一起解一道题,这样讨论问题更加集中,会得到更多的反馈。而且这些题目可以被记录下来,日后会进行筛选添加到仓库的题解模块
第五部分是计划,这里会记录将来要加入到以上三个部分内容
LeetCode 解题攻略其中的算法,主要是以下几种:
基础技巧:分治、二分、贪心
排序算法:快速排序、归并排序、计数排序
搜索算法:回溯、递归、深度优先遍历,广度优先遍历,二叉搜索树等
图论:最短路径、最小生成树
动态规划:背包问题、最长子序列
数据结构,主要有如下几种:
数组与链表:单 / 双向链表
栈与队列
哈希表
堆:最大堆 / 最小堆
树与图:最近公共祖先、并查集
字符串:前缀树(字典树) / 后缀树
优秀的编程水平绝非一蹴而就。即使在非求职面试期间,大家也不妨做一些算法题保持“手感”,题目的数量不一定多,但每做一道题都能保证自己完全掌握,并不断优化自己的代码。不积跬步无以至千里,在技术提升的路上,小汇汇一直伴你左右。
-END-
以上是关于扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析的主要内容,如果未能解决你的问题,请参考以下文章
扎实打牢数据结构算法根基,从此不怕算法面试系列之005 week01 02-05 使用自定义类测试我们前面实现的支持泛型的线性查找法
扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析