算法笔记 9 二分查找
Posted 珷玞的日常
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了算法笔记 9 二分查找相关的知识,希望对你有一定的参考价值。
基础
二分查找针对的是一个有序的数据集合。每次都与区间中间的数据比较大小,将待查找的范围缩小到原来的一半,直到找到要查找的元素,或者区间被缩小为 0。
时间复杂度为 O(nlogn)。
二分查找的递归和非递归实现
# 循环实现
def binarySearch(l,data):
n = len(l)
low = 0
high = n - 1
while(low <= high):
# mid = (low + high)//2
mid = low + (high - low )//2
if l[mid] == data:
return mid
if l[mid] < data:
low = mid + 1
if l[mid] > data:
high = mid - 1
return -1
# 递归实现
def binarySearch2(l,data):
n = len(l)
return binarySearch21(l,data,0,n-1)
def binarySearch21(l,data,low,high):
if(low > high):
return -1
mid = low + (high - low) // 2
if l[mid] == data:
return mid
if l[mid] > data:
return binarySearch21(l,data,0,mid-1)
if l[mid] < data:
return binarySearch21(l,data,mid+1,len(l)-1)
二分查找局限性
二分查找依赖的是顺序表结构,简单说就是数组。
由于二分查找需要按照元素下标来访问,如果是链表这种结构,随机访问时间复杂度是在太高,使用二分查找就会很慢。
二分查找针对有序数据
如果数据无序,那么必须先进行排序。如果数据有频繁的插入删除操作,那么必须保证插入删除操作之后,数据仍然是有序的。对于这种情况,对数据的维护成本比较高,使用起来就不是那么方便。
数据量太小或者太大不适合二分查找
如果数据量很小,顺序遍历和二分查找时间差距不是很大;数据量太大,由于二分查找依赖数组这种数据结构,对内存的要求比较严苛。
二分查找的几种变形
查找第一个值等于给定值的元素
代码如下:
def binarySfirst(l,data):
n = len(l)
low = 0
high = n-1
while(low <= high):
mid = low + (high - low)//2
if l[mid] > data:
high = mid-1
if l[mid] < data:
low = mid + 1
# 主要是处理相等的时候,这个是不是第一个
if l[mid] == data:
if mid == 0 or l[mid-1] != data:
return mid
else:
high = mid-1
在这种情况下,其实主要是特殊处理当 l[mid] 和 data 相等的时候,检查是不是第一个的问题,从 13 行开始,我们添加一部分代码执行这个功能。
检查的条件也很简单:
mid == 0
l[mid-1] != data
如不满足这两个条件,那么在这个元素之前一定有一个和它值相同的元素,我们再次将范围定到 [0,mid-1] 中重新寻找。
查找最后一个等于给定值的位置
这和前边的很相似,就是检查条件稍微变动一下,其他的没什么。代码如下:
def binarySlast(l,data):
n = len(l)
low = 0
high = n-1
while(low <= high):
mid = low + (high - low)//2
if l[mid] > data:
high = mid-1
if l[mid] < data:
low = mid + 1
if l[mid] == data:
if mid == 0 or l[mid+1] != data:
return mid
else:
low = mid + 1
以上是关于算法笔记 9 二分查找的主要内容,如果未能解决你的问题,请参考以下文章