牛顿法和二分法精度上的区别
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了牛顿法和二分法精度上的区别相关的知识,希望对你有一定的参考价值。
参考技术A 二分法我们要介绍的第一个方法是二分法。
说到二分法大家应该都不陌生,老实说我第一次在高数课本上看到二分法这三个字的时候,其实是蛮震惊的。后来当我又在统计等数学书上看到许多其他算法之后,才慢慢习以为常。在我转行做算法的这几年当中,我越来越意识到,数学的重要性。虽然这并不意味着你一定要成为数学高手,但如果你还没毕业的话,至少数学课好好听讲还是很有必要的。
我们说回二分法,如果学过二分法,会觉得这是一个非常简单的算法,但如果你们做过LeetCode第四题,又会发现纯二分法的题也可以这么难。如果只是单纯地讲解二分法的原理,我们是很难完完全全将这个算法吃透的。为了达到这点,我思考了很久,最终决定仿照看山是不是山的禅宗理论,将二分法也分成三个层次。
首先是第一个层次,即我们每次将一个东西分成两半。
这个应该是我们最初也是最直观的观念,比如最经典的金币问题。说是我们有若干个个硬币,其中有一个是金币,金币的重量更重,其他的硬币重量相等。我们只有一个天平,怎么样用最少的次数找出金币。
在这个问题当中,我们需要不停地将硬币分成两个部分,用天平锁定其中的一个。通过不断重复上述操作,快速找到答案。
在第二个层次当中,二分法不再是简单地将物体一分为二,而是一个折半查找的函数。这也是本文重点要介绍的解方程的方法。
如果有函数[公式],它在区间[a, b]上递增或者递减,并且[公式]。那么我们知道函数必然有一个等于0的解,而且这个解我们可以用二分法来求近似解。
实现 sqrt(x):二分查找法和牛顿法
最近忙里偷闲,每天刷一道 LeetCode 的简单题保持手感,发现简单题虽然很容易 AC,但若去了解其所有的解法,也可学习到不少新的知识点,扩展知识的广度。
创作本文的思路来源于:LeetCode Problem 69. x 的平方根
简述题目大意(不想跳转链接,可以看这里):给定一个非负整数 x,要求计算并返回 x 的平方根(取整)。例如,输入 4,则输出 2;输入 8,则输出 2(8 的平方根是 2.82842……,由于返回类型是整数,因此小数部分被舍去)。即给定一个 (x),我们要计算出 (lfloor sqrt{x} floor)。
最简单最直觉的方法自然是从 0 开始遍历,直到找到第一个其平方值大于 (x) 的数 (n),则 (n-1) 即是答案。对于任意的 (x),其取整后平方根一定在 ([0, x]) 区间上,代码如下:
int sqrt(int x)
{
if (x == 0)
return x;
int ans = 1;
while (ans <= x / ans)
ans++;
return ans - 1;
}
这里需要注意的有两点:
- 第 6 行代码中,
while
的判断条件可以避免溢出。很大概率上,你可能会写成while (ans * ans <= x)
,这更自然、更直观,但当ans
的值很大时,ans * ans
的结果可能会超过int
类型的最大表示范围。举个例子,比如我们要计算 (x) 的取整平方根(其值为 (n),即 (lfloor sqrt{x} floor = n)),算法会将ans
遍历到第一个平方超过 (x) 的值,即 (n+1) 后停止。如果 (x) 的值就是int
类型能够表示的最大值,那么当ans
遍历到 (n+1) 时,计算ans * ans
的结果就超出了int
类型的表示范围。 - 由于在
while
的循环判断中,我们用除法代替了乘法,因此ans
便不能再从 0 开始遍历(否则会导致除零错误)。为此,我们可以在算法开始单独处理 (x = 0) 的情况,然后让ans
从 1 开始遍历。
作为一道简单题,这种暴力朴素的算法自然是可以 AC 的。但其效率极低(需要遍历 (O(sqrt{n})) 次),在 LeetCode 上的时间效率只能快过约 5% 的用户,使用 C++ 语言的运行时间平均要 90ms 以上。因此,本文提供了两种更加高效的算法:二分查找法和牛顿法。
1. 二分查找法
如果你在暴力求解的基础上继续思考,很大概率会想到用二分搜索求解。
没错,思考暴力求解的策略,我们在区间 ([0, x]) 上搜索解,而搜索区间 ([0, x]) 天然是有序的,自然可以用二分搜索代替线性搜索,以大大提高搜索效率。
更进一步的,我们还可以缩小我们的搜索区间。直觉告诉我们,对于一个非负整数 (x),其 (sqrt{x}) 应该不会大于 (x / 2)(例如,(sqrt{25} = 5),小于 (25 / 2 = 12.5))。我们可以证明:
[ egin{aligned} & ext{设 } y = frac{x}{2} - sqrt{x}, ext{ 则 } y^prime = frac{1}{2} - frac{1}{2sqrt{x}}, \\[2ex] & ext{令 } y^prime = 0, ext{ 可得驻点 } x = 1, \\[2ex] & ext{当 } x > 1 ext{ 时}, y^prime > 0, ext{ 即当 } x > 1 ext{ 时 }, y = frac{x}{2} - sqrt{x} ext{ 的值单调递增}, \\[2ex] & ext{可推出, 当 } x > 1 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor ext{ 的值单调递增}, \\[2ex] & ext{又因为当 } x = 2 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor = 0, \\[2ex] & ext{所以当 } x geq 2 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor geq 0, ext{ 即 } x geq 2 ext{ 时},lfloor frac{x}{2} floor geq lfloor sqrt{x} floor & ext{(证毕)} end{aligned} ]
通过证明我们可以得知,当所求的 (x) 大于等于 (2) 时,sqrt(x)
的搜索空间为 ([1, x / 2]),对于 (x < 2) 的情况,我们只要特殊处理即可(这里我们也可以得到结论:当 (x geq 1) 时,(lfloor frac{x}{2}
floor + 1 geq lfloor sqrt{x}
floor),然后单独处理 (x < 1) 的情况)。代码:
int sqrt(int x)
{
if (x < 2) // 处理特殊情况
return x;
int left = 1, right = x / 2;
while (left <= right) {
# 避免溢出,相当于 mid = (left + right) / 2
int mid = left + ((right - left) >> 1);
if (mid == x / mid)
return mid;
else if (mid > x / mid)
right = mid - 1;
else
left = mid + 1;
}
return right;
}
在这里解释一下最后的返回值为什么是 right
。对于二分查找,其搜索空间会不断收缩到 left == right
(关于二分查找,这里不多赘述,自行手动模拟即可),此时 mid
、left
和 right
三者的值相等(mid = (left + right) / 2
)。根据二分查找的搜索范围的收缩条件可知,left
(或 mid
)左侧的值都小于等于 (lfloor sqrt{x}
floor),right
(或 mid
)右侧的值都大于 (lfloor sqrt{x}
floor),此时(while
的最后一次循环),判断 mid
的平方与 x
的大小,有三种情况:
mid == x / mid
。则在循环内直接返回mid
的值。mid > x / mid
。这种情况下,因为mid
左侧的值都小于等于 (lfloor sqrt{x} floor),而mid
的值大于 (x),则mid-1
即是答案。而按照分支条件,执行right = mid - 1
,可知right
的值正是应返回的值。此时,循环结束,应返回right
。mid <= x / mid
。这种情况下,mid
、left
和right
正是计算答案(右边的值都大于 (lfloor sqrt{x} floor))。按照分支条件,执行left = mid + 1
,循环结束。此时,mid
和right
的值为计算结果。
综合上面三点可知,如果 while
循环结束,则 right
保存的值一定是计算结果。
和之前的暴力法相比,使用二分查找的思想求解 sqrt(x)
,只需要循环遍历 (O(lg{frac{x}{2}})) 次;空间复杂度为 (O(1))。
2. 牛顿—拉弗森迭代法
牛顿—拉弗森迭代法(简称牛顿法)使用以直代曲的思想,是一种求解函数的方法,不仅仅适用于求解开方计算。当然使用牛顿法求解函数也存在很多坑,但对于求解开方而言,牛顿法是安全的。关于这一方法,你需要掌握一定的高等数学知识,想了解详细的内容,可以参考链接:如何通俗易懂地讲解牛顿迭代法求开方?数值分析?—马同学的回答
简单的理解,可以参考图片:
图片来源:牛顿法与拟牛顿法
给定任意一个非负整数 (n),我们想要找到一个 (x = lfloor sqrt{n} floor),这相当于我们要计算函数 (f(x) = x^2 - n) 的根。我们首先需要先给出一个猜测值 (x_0),不妨令 (x_0 = frac{x}{2} + 1)(证明见第一小节),然后在 (f(x_0)) 处作函数的切线,切线与 (x) 轴的交点,即为一次迭代后的值 (x_1)。若 (x_1) 不是要得到的结果,则继续迭代,在 (f(x_1)) 处作函数的切线,切线与 (x) 轴的交点,即为第二次迭代后的值 (x_2)。以此类推,直到得到 (x_n = lfloor sqrt{n} floor)。
现在我们来推导迭代式。对于 (x_i),其函数值为 (f(x_i)),则对于点 ((x_i, f(x_i))),可得其切线方程:
[ egin{align} &y - f(x_i) = f(x_i)^prime(x - x_i) \\[2ex] implies &y - (x_i^2 - n) = 2x_i(x - x_i) \\[2ex] implies &y + x_i^2 + n = 2x_ix end{align} ]
又因为 (x_{i+1}) 为切线与 (x) 轴的交点,所以令 (y=0),可得:
[ x_{i+1} = (x_i + n / x_i) / 2 ]
现在,我们就可以根据迭代式编写代码了:
int sqrt(int x)
{
// 避免除零错误,单独处理 x = 0 的情况
if (x == 0)
return x;
int t = x / 2 + 1;
while (t > x / t)
t = (t + x / t) / 2;
return t;
}
为了确保算法是正确的,我们还需要一些额外的证明。首先,证明迭代式是单调递减的:
[ x_{i+1} - x_i = leftlfloor frac{1}{2} (x_i + frac{n}{x_i}) ight floor - x_i = leftlfloor frac{1}{2} (frac{n}{x_i} - x_i) ight floor ]
可知,在区间 ([sqrt{x}, +infty)) 上,(x_{i+1} - x_i < 0)。
然后,我们还要证明迭代式是可以收敛到 (lfloor sqrt{n} floor) 的:
[ x_{i+1} = leftlfloor frac{1}{2} left( x_i + leftlfloor frac{n}{x_i} ight floor ight) ight floor = left lfloor frac{1}{2} (x_i + frac{n}{x_i}) ight floor geq left lfloor frac{1}{2} imes 2 imes sqrt{x_i cdot frac{n}{x_i}} ight floor = lfloor sqrt{n} floor ]
因此,当 while
循环结束时,我们可以得到正确的答案。
关于牛顿法求 sqrt(x)
的时间复杂度,笔者目前也没有搞清楚,有了解的童鞋欢迎交流~。不过通过查询资料,以及实际测试,可知牛顿法的时间效率优于二分搜索法。
以上是关于牛顿法和二分法精度上的区别的主要内容,如果未能解决你的问题,请参考以下文章
什么是牛顿法(Newton methods)?什么是拟牛顿法(Quasi Newton methods)?牛顿法和梯度下降法的区别是什么?