数据结构和算法(初涉)
Posted 落别雨
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据结构和算法(初涉)相关的知识,希望对你有一定的参考价值。
一、绪论
-
程序设计 = 数据结构 + 算法
-
数据结构 → 数据元素相互之间存在的一种或多种特定关系的集合
-
数据结构分为逻辑结构和物理结构
- 逻辑结构:数据对象元素之间的相互关系
- 物理结构:数据的逻辑结构在计算机中的存储形式
四大逻辑结构
- 集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他任何关系(集合)
- 线性结构:数据元素之间是一对一的关系(链表)
- 树形结构:元素之间存在一种一对多的层次关系(树)
- 图形结构:数据元素之间是多对多的关系(图)
* 物理结构
- 根据物理结构定义,可知物理结构研究的其实是如何把数据元素存储到计算机的存储器中
- 数据元素的存储结构形式有两种:顺序存储和链式存储
- 顺序结构:将数据元素存放在地址
连续的存储单元
里,其数据间的逻辑关系和物理关系是一致的(数组结构) - 链式结构:
- 把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
- 链式结构的数据元素存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,这样子通过地址就可以找到相关联数据元素的位置
- 顺序结构:将数据元素存放在地址
二、算法
-
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
-
五个特征:输入、输出、有穷性、确定性、可行性
- 输入:算法具有零个或多个输入(参数)
- 输出:算法至少有一个或多个输出
- 有穷性:算法在执行一定得到步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成
- 确定性:
- 算法的每一个步骤都具有确定的含义,不会出现二义性
- 算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果
- 算法的每一个步骤都应该被精确定义而无歧义
- 可行性:算法的每一步都能够通过执行有限次数完成
-
算法的设计要求
-
正确性
- 算法至少应该具备输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案
- 可分为四个四个层次
- 1、算法程序没有语法错误
- 2、对于合法的输入能够产生满足要求的输出
- 3、对于非法的输入能够产生满足规格的说明
- 4、算法程序对于故意刁难的测试输入都有满足要求的输出结果
-
可读性
- 方便阅读、理解、交流、以及他人修改
-
健壮性
- 当输入数据不合法时,算法也能够做出相关处理,而不是产生异常、崩溃或莫名其妙的结果
-
时间效率高和存储量低
-
三、时间复杂度和空间复杂度
算法效率的度量方法
-
事后统计法,利用时间计时器,缺陷较大
-
事前分析估算法:在计算机程序编写前,依据统计方法对算法进行估算
-
抛开计算机硬件、软件有关的因素,一个程序的运行时间依赖于算法的好坏和问题的输入规模(输入量的多少)
-
研究算法的复杂度,侧重研究的是输入规模扩大增长量的一个抽象,并非精确到执行多少次;
-
不计循环索引的递增或循环终止条件、变量声明、打印结果等操作;最重要的是把程序看成是独立于程序设计语言的算法或一系列步骤
-
基本操作数量<=关联=>输入模式
-
函数的渐近增长
- 函数的渐近增长:给定两个函数f(n)和g(n),如果存在一个整数N,使得对于所有的n>N,f(n)总是大于g(n),那么,我们说f(n)的增长渐近快于g(n);
- 随着规模增大时,函数中的常数和其他次要项常常可以忽略,而应关注最高项的阶数
算法的时间复杂度
-
定义:语法总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n) = O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称时间复杂度。f(n)是问题规模n的某个函数。==>(执行次数 == 时间)
-
随着输入规模n的增大,T(n)增长最慢的算法为最优算法。
-
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数(如:3n^2 --> n^2)。
- 常数阶、线性阶、平方阶、次方阶、对数阶、nlogn阶、指数阶…
- 从小到大:O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)
-
函数调用的时间复杂度
//例子
int i, j;
for (i = 0; i < n; i++){
function(i);
}
void function(int count){
int j;
for (j = count; j < n; j++){
printf( "%d", j);
}
}
函数内部循环次数–外部循环次数,n + (n-1) + (n-2) +…+ 1 = (n+1)n/2 ==>时间复杂度:O(n^2)
-
最坏情况与平均情况
- 最坏运行时间是一种保证,这是一种最重要的需求;通常除法特别指定,一般提到的运行时间都是最坏情况的运行时间
- 平均运行时间是期望的运行时间
-
算法的空间复杂度
- 计算算法所需的存储空间实现,算法的空间复杂度的计算公式为:s(n) = 0(f(n)),其中n为问题规模,f(n)为语句关于所占存储空间的函数。
-
通常,“时间复杂度”来指运行时间的需求,用“空间复杂度”指空间的需求。复杂度通常指时间复杂度
以上是关于数据结构和算法(初涉)的主要内容,如果未能解决你的问题,请参考以下文章