数据结构与算法14—查找

Posted 2021-11-30 lisen10

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据结构与算法14—查找相关的知识，希望对你有一定的参考价值。

查找

基本概念

查找就是在数据集中找出一个“特定元素”。

查找表是由同一类型的数据元素(或记录)构成的集合。

查找表是一种以集合为逻辑结构、以查找为核心的数据结构。

关键字

有时候我们需要指定某数据项的值来查找，这就用到了关键字。

关键字是数据元素中某个数据项的值，用以标识一个数据元素。

若此关键字可以识别唯一的一个记录，则称之谓“主关键字”；若此关键字能识别若干记录，则称之谓“次关键字”。

例：

技术图片

对查找表经常进行的操作:

1）查询某个“特定的”数据元素是否在查找表中；

2）检索某个“特定的”数据元素的各种属性；

3）在查找表中插入一个数据元素；

4）从查找表中删去某个数据元素。

查找表可分为两类:

静态查找：仅作查询和检索操作。查找前后查找表未发生变化。

动态查找：在查询之后，将 “不在查找表中”的数据元素插入到查找表中；或者，从查找表中删除“在查找表中”的数据元素。查找前后查找表发生了变化。

采用何种查找方法，取决于使用哪种数据结构来表示“查找表”。即表中记录是按何种方式组织的，根据不同的数据结构采用不同的查找方法。

平均查找长度:

查找算法中的基本运算是记录的关键字与给定值所进行的比较。其执行时间通常取决于关键字的比较次数，也称为平均查找长度ASL 。

ASL是衡量一个查找算法优劣的重要指标。

定义为：

技术图片

n 是查找表中记录的个数

P_i 是查找第i个记录的概率

C_i 是找到第i个记录所需进行的比较次数。

静态查找

线性表查找属于静态查找，是将查找表视为一个线性表，将其顺序或链式存储，再进行查找，因此查找思想较为简单，效率不高。如果查找表中的数据元素有一定的规律（如按关键字有序），可以利用这些信息获得较好的查找效率。

顺序查找

即数据存储在顺序表中，然后逐项查找元素。

实现：

#define  MAXNUM  100    /*查找表的容量*/
typedef  int  KeyType;
typedef   struct{
    KeyType  key;     /*关键字字段*/
}DataType;
typedef struct{
    DataType  data[MAXNUM];   /*存储空间*/
    int n;  /*元素个数*/
}SeqList;

int Seq_Search_1 (SeqList list, KeyType kx)
{/*数据存放在list.data[1] 至list.data[n]中，在表list中查找关键字为kx的数据元素*/
/*若找到返回该元素在查找表中的位置，否则返回0*/
    int i=1;
    while(i<=list.n && list.data[i].key!= kx ) 
        i++;   /* 从表头端向后查找 */
    if (i>list.n) 
        return 0;
    else  
        return  i; 
}

加监视哨后的顺序查找：

int Seq_Search_2(SeqList list, KeyType kx)
{ /*数据存放在list.data[1] 至list.data[n]中，在表list中查找关键字为kx的数据元素*/
/*若找到返回该元素在查找表中的位置，否则返回0 */
    int i;
    list.data[0].key=kx;    
    i=list.n;
    while(list.data[i].key!= kx ) 
        i--;  /* 从表尾端向前查找 */
    return i;
}

比较次数减少了，效率提高。

顺序表上的顺序查找的性能分析

对于n个元素的查找表，若查找的是表中第i个记录时，需进行n-i+1次关键字比较，即c_i=n-i+1。

设查找每个元素的概率相等。查找成功时，顺序查找的平均查找长度为：

技术图片

查找不成功时，表中每个关键字都要比较一次，直到监视哨，因此关键字的比较次数总是n+1次，显然时间复杂度为O(n)。

顺序查找的特点

顺序查找的优点是算法简单，对表中数据元素的存储方式、是否按关键字有序均无要求；
缺点是平均查找长度较大，效率低，当n很大时，不宜采用顺序查找。

为了提高查找效率，查找表中的数据存放需依据查找概率越高，使其比较次数越少；查找概率越低，比较次数可相对较多的原则来存储数据元素。

有序表查找

有序表是指查找表中的元素按关键字大小有序存储。
如果查找表采用顺序结构存储且按关键字有序，那么查找时可采用效率较高的折半查找算法实现。

二分查找（折半查找）

折半查找的思想为：

在有序表中，取中间元素作为比较对象，若给定值与中间元素的关键字相等，则查找成功；若给定值小于中间元素的关键字，则在中间元素的左半区继续查找；若给定值大于中间元素的关键字，则在中间元素的右半区继续查找。不断重复上述查找过程，直到查找成功，或所查找的区域无数据元素，查找失败。

算法实现：

int Binary_Search(SeqList list, KeyType kx)
{ /*数据存放在list.data[1] 至list.data[n]中，在表list中查找关键字为kx的数据元素*/  
/*若找到返回该元素在表中的位置，否则返回0  */
  int mid,low=1, high=list.n;   /*设置初始区间 */
  while(low<=high) {   /*当查找区间非空*/
      mid=(low+high)/2;  /*取区间中点 */
      if(kx==list.data[mid].key) 
          return mid;  /* 查找成功，返回mid */
      else if (kx<list.data[mid].key) 
          high=mid-1;   /* 调整到左半区 */
      else low=mid+1;     /* 调整到右半区 */   
  }
  return  0;     /* 查找失败，返回0 */
}