《算法之道》精华 经典算法部分

Posted gavanwanggw

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《算法之道》精华 经典算法部分相关的知识,希望对你有一定的参考价值。

《算法之道》精华 经典算法部分

  • 本书作者邹恒明,作者另有一本书《数据结构之弦》,以及《操作系统之哲学原理》都是非常好的书
  • 这本书能够算得上是深入浅出,文笔非常好。作者加入了非常多自己的思考
  • 本文包含经典算法部分

第十章 排序与次序

  • 插入排序
    • 从无序部分抽取一张插入有序部分
    • 为原地排序。无需占用暂时存储空间
    • 最优情况下为O(n)。平均O(n^2)
  • 折半插入排序
    • 插入时使用二分查找
  • 归并排序
    • 分治,从中间分解,分别排序后进行细致的合并
    • 异地排序,须要占用额外空间
    • n>=30时性能比插入排序更好。

      复杂度固定为O(nlog(n))

  • 快排
    • 分治,复杂的部分在于分解。而归并复杂在于合并
    • 原地排序
    • 最坏情况为O(n^2),但仅仅要不是每次都是最坏,复杂度就不是n^2,具有韧性
  • 不论什么基于比較的排序,决策树高度至少为nlog(n)
  • 计数排序
    • 元素值范围必须有限
    • 空间复杂度高
    • O(n)
  • 基数排序
    • 从最低位到最高位排序,每一位排序都採用稳定排序,如计数排序
    • 一位排序应该选择log(n)个比特。使总体成本最低
  • 桶排序
    • 把n元素按值分到n个桶里,每一个桶内部进行插入排序。将各桶首位相连
    • 元素应该是均匀分布
  • 高速次序选择:求第K大的数
    • 使用快排的partition
    • 最差O(n^2)。平均O(n)
  • 线性最差高速次序选择
    • 将元素每5个一组。分别取中值。在n/5个中值里面找到中值,作为partition的pivot
    • 为什么*不每3个一组?
    • 保证pivot左边右边至少3n/10个元素
    • 最差O(n)

第十一章 搜索与散列

  • 顺序搜索
    • 在序列里面假设搜索频率从头到尾指数递减。则为O(1)
  • 折半搜索
    • 对于有序序列,为O(logn)
  • 常数搜索:散列搜索
    • 直接散列:很easy,不会发生碰撞,空间浪费大
    • 除法(模除法)散列
      • 元素对散列表大小m取模得到
      • m必须为素数,否则造成不均匀散射。比方m包括因子d,而大部分元素对d余数相等
      • m不能靠近2的幂。如m为2的幂,散列结果将不依赖元素的全部位。靠近也不行,为什么
    • 乘法散列
      • h(k) = (A * k ) % 2^r >> (w - r)。w为计算机字宽,A为2^(w-1)与2^w之间的一个奇数
      • 乘方取中法:乘方n次(常取n=2),取中间r位
  • 开放寻址散列:散列碰撞时纵深扩展,加入一个链表
    • 平均搜索时间为O(1+a),a为载入因子
  • 封闭寻址散列:散列碰撞时为元素找到还有一个位置
    • 找还有一个位置的操作称为探寻
    • 线性探寻
      • h(k,i) = (h‘(k) + i) % m,h‘(k)为家位
      • 向单方向寻找未被占用的位置
      • 易出现顶级聚集
    • 非线性探寻
      • 平方探寻 h(k,i) = (h‘(k) + c1 * i + c2 * i^2) % m 易出现次级聚集
    • 双重散列探寻
      • 使用两个散列函数h1、h2来构造新散列函数
      • h(k,i) = (h1(k) + i * h2(k) ) mod m
    • 伪随机探寻
      • 使用伪随机序列
      • 存在次级聚集
    • 不成功搜索的探寻次数期望为1/(1-a)
    • 成功搜索探寻次数最多为1 / a * ln( 1/(1-a))
    • 封闭散列不能删除元素。能够放标记解决。假设插入相比搜索很稀疏,则能够通过又一次散列解决空位问题
  • 随机化散列
    • 找到一组散列函数。每次随机选择一个不同的散列函数
    • 用于避免单个散列函数极端情况下聚集效应严重
    • 全域散列
      • 一组H个散列函数,将随意两个不同的元素映射到同一位置的函数个数为H/m
  • 完美散列
    • n个元素。构造m=O(n)大小的散列表,使搜索最坏达到O(1)
    • 採用双层散列,第一层大小n,第二层每一个表的大小为落到第一层位置i上的元素个数的平方
    • 空间消耗为O(n)

第十二章 最短路径

  • 假设图中有负环,则不存在最短路径
  • 单源多点最短路径
    • Dijkstra算法
      • 贪婪算法。要求不存在负路径
      • 最优子结构:最短路径里的每一段都是两点之间的最短路径
      • 贪婪选择属性:路径向外延伸的下一个节点就是离源点近期的节点
      • 每次选取离源点近期的节点,更新全部与此节点相邻节点的距离
      • 时间复杂度为O(V^2)。採用堆实现。能够达到O(E log(V))。

        与Prim算法同样

    • Bellman-Ford算法
      • 能够应对负权重
      • 进行V-1轮降距,每次更新图中全部边
      • 复杂度为O(VE)
    • BFS
      • 各边权重相等的情况
      • O(V+E)
  • 多源多点最短路径
    • Floyd-Warshall算法
      • 动态规划算法
      • 子问题为从i到j,中间结点仅仅属于集合1...k的最短路径长度
      • c_ijk = min{c_ij(k-1), c_ik(k-1) + ckj(k-1)}|k
      • 复杂度O(n^3)
    • Jonhson算法
      • 等效变换为无负权重的图,使用Dijkstra算法
      • 加入一个节点s,到全部点路径长度为0,执行Bellman-Ford算法,对节点赋值
      • 对每一个节点执行Dijkstra算法
      • 复杂度主要是Dijkstra算法运算,为O(VE + V^2 log(V))
      • 若Bellman-Ford算法报告有负环存在,不能使用此方法

  
  

转载请注明作者:Focustc,博客地址为http://blog.csdn.net/caozhk,原文链接为点击打开

  
  

以上是关于《算法之道》精华 经典算法部分的主要内容,如果未能解决你的问题,请参考以下文章

C语言100个经典算法源码片段

百面03_经典算法

C语言精华知识:表驱动法编程实践

经典算法书籍推荐以及算法书排行算法四库全书

用 Python 实现十大经典排序算法

C语言表驱动法编程实践(精华帖,建议收藏并实践)