牛顿法和二分法精度上的区别

Posted 2023-04-23

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了牛顿法和二分法精度上的区别相关的知识，希望对你有一定的参考价值。

参考技术A 二分法

我们要介绍的第一个方法是二分法。

说到二分法大家应该都不陌生，老实说我第一次在高数课本上看到二分法这三个字的时候，其实是蛮震惊的。后来当我又在统计等数学书上看到许多其他算法之后，才慢慢习以为常。在我转行做算法的这几年当中，我越来越意识到，数学的重要性。虽然这并不意味着你一定要成为数学高手，但如果你还没毕业的话，至少数学课好好听讲还是很有必要的。

我们说回二分法，如果学过二分法，会觉得这是一个非常简单的算法，但如果你们做过LeetCode第四题，又会发现纯二分法的题也可以这么难。如果只是单纯地讲解二分法的原理，我们是很难完完全全将这个算法吃透的。为了达到这点，我思考了很久，最终决定仿照看山是不是山的禅宗理论，将二分法也分成三个层次。

首先是第一个层次，即我们每次将一个东西分成两半。

这个应该是我们最初也是最直观的观念，比如最经典的金币问题。说是我们有若干个个硬币，其中有一个是金币，金币的重量更重，其他的硬币重量相等。我们只有一个天平，怎么样用最少的次数找出金币。

在这个问题当中，我们需要不停地将硬币分成两个部分，用天平锁定其中的一个。通过不断重复上述操作，快速找到答案。

在第二个层次当中，二分法不再是简单地将物体一分为二，而是一个折半查找的函数。这也是本文重点要介绍的解方程的方法。

如果有函数[公式]，它在区间[a, b]上递增或者递减，并且[公式]。那么我们知道函数必然有一个等于0的解，而且这个解我们可以用二分法来求近似解。

实现 sqrt(x)：二分查找法和牛顿法

最近忙里偷闲，每天刷一道 LeetCode 的简单题保持手感，发现简单题虽然很容易 AC，但若去了解其所有的解法，也可学习到不少新的知识点，扩展知识的广度。

创作本文的思路来源于：LeetCode Problem 69. x 的平方根

简述题目大意（不想跳转链接，可以看这里）：给定一个非负整数 x，要求计算并返回 x 的平方根（取整）。例如，输入 4，则输出 2；输入 8，则输出 2（8 的平方根是 2.82842……，由于返回类型是整数，因此小数部分被舍去）。即给定一个 (x)，我们要计算出 (lfloor sqrt{x} floor)。

最简单最直觉的方法自然是从 0 开始遍历，直到找到第一个其平方值大于 (x) 的数 (n)，则 (n-1) 即是答案。对于任意的 (x)，其取整后平方根一定在 ([0, x]) 区间上，代码如下：

int sqrt(int x)
{
    if (x == 0)
        return x;
    int ans = 1;
    while (ans <= x / ans)
        ans++;
    return ans - 1;
}

这里需要注意的有两点：

第 6 行代码中，while 的判断条件可以避免溢出。很大概率上，你可能会写成 while (ans * ans <= x)，这更自然、更直观，但当 ans 的值很大时，ans * ans 的结果可能会超过 int 类型的最大表示范围。举个例子，比如我们要计算 (x) 的取整平方根（其值为 (n)，即 (lfloor sqrt{x} floor = n)），算法会将 ans 遍历到第一个平方超过 (x) 的值，即 (n+1) 后停止。如果 (x) 的值就是 int 类型能够表示的最大值，那么当 ans 遍历到 (n+1) 时，计算 ans * ans 的结果就超出了 int 类型的表示范围。
由于在 while 的循环判断中，我们用除法代替了乘法，因此 ans 便不能再从 0 开始遍历（否则会导致除零错误）。为此，我们可以在算法开始单独处理 (x = 0) 的情况，然后让 ans 从 1 开始遍历。

作为一道简单题，这种暴力朴素的算法自然是可以 AC 的。但其效率极低（需要遍历 (O(sqrt{n})) 次），在 LeetCode 上的时间效率只能快过约 5% 的用户，使用 C++ 语言的运行时间平均要 90ms 以上。因此，本文提供了两种更加高效的算法：二分查找法和牛顿法。

1. 二分查找法

如果你在暴力求解的基础上继续思考，很大概率会想到用二分搜索求解。

没错，思考暴力求解的策略，我们在区间 ([0, x]) 上搜索解，而搜索区间 ([0, x]) 天然是有序的，自然可以用二分搜索代替线性搜索，以大大提高搜索效率。

更进一步的，我们还可以缩小我们的搜索区间。直觉告诉我们，对于一个非负整数 (x)，其 (sqrt{x}) 应该不会大于 (x / 2)（例如，(sqrt{25} = 5)，小于 (25 / 2 = 12.5)）。我们可以证明：

[ egin{aligned} & ext{设 } y = frac{x}{2} - sqrt{x}, ext{ 则 } y^prime = frac{1}{2} - frac{1}{2sqrt{x}}, \\[2ex] & ext{令 } y^prime = 0, ext{ 可得驻点 } x = 1, \\[2ex] & ext{当 } x > 1 ext{ 时}, y^prime > 0, ext{ 即当 } x > 1 ext{ 时 }, y = frac{x}{2} - sqrt{x} ext{ 的值单调递增}, \\[2ex] & ext{可推出, 当 } x > 1 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor ext{ 的值单调递增}, \\[2ex] & ext{又因为当 } x = 2 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor = 0, \\[2ex] & ext{所以当 } x geq 2 ext{ 时}, lfloor frac{x}{2} floor - lfloor sqrt{x} floor geq 0, ext{ 即 } x geq 2 ext{ 时}，lfloor frac{x}{2} floor geq lfloor sqrt{x} floor & ext{(证毕)} end{aligned} ]

通过证明我们可以得知，当所求的 (x) 大于等于 (2) 时，sqrt(x) 的搜索空间为 ([1, x / 2])，对于 (x < 2) 的情况，我们只要特殊处理即可（这里我们也可以得到结论：当 (x geq 1) 时，(lfloor frac{x}{2} floor + 1 geq lfloor sqrt{x} floor)，然后单独处理 (x < 1) 的情况）。代码：

int sqrt(int x)
{
    if (x < 2)  // 处理特殊情况
        return x;
    
    int left = 1, right = x / 2;
    while (left <= right) {
        # 避免溢出，相当于 mid = (left + right) / 2
        int mid = left + ((right - left) >> 1);
        if (mid == x / mid)
            return mid;
        else if (mid > x / mid)
            right = mid - 1;
        else
            left = mid + 1;
    }
    return right;
}

在这里解释一下最后的返回值为什么是 right。对于二分查找，其搜索空间会不断收缩到 left == right（关于二分查找，这里不多赘述，自行手动模拟即可），此时 mid、left和 right 三者的值相等（mid = (left + right) / 2）。根据二分查找的搜索范围的收缩条件可知，left（或 mid）左侧的值都小于等于 (lfloor sqrt{x} floor)，right（或 mid）右侧的值都大于 (lfloor sqrt{x} floor)，此时（while 的最后一次循环），判断 mid 的平方与 x 的大小，有三种情况：

mid == x / mid。则在循环内直接返回 mid 的值。
mid > x / mid。这种情况下，因为 mid 左侧的值都小于等于 (lfloor sqrt{x} floor)，而 mid 的值大于 (x)，则 mid-1 即是答案。而按照分支条件，执行 right = mid - 1，可知 right 的值正是应返回的值。此时，循环结束，应返回 right。
mid <= x / mid。这种情况下，mid、left 和 right 正是计算答案（右边的值都大于 (lfloor sqrt{x} floor)）。按照分支条件，执行 left = mid + 1，循环结束。此时，mid 和 right 的值为计算结果。

综合上面三点可知，如果 while 循环结束，则 right 保存的值一定是计算结果。

和之前的暴力法相比，使用二分查找的思想求解 sqrt(x)，只需要循环遍历 (O(lg{frac{x}{2}})) 次；空间复杂度为 (O(1))。

2. 牛顿—拉弗森迭代法

牛顿—拉弗森迭代法（简称牛顿法）使用以直代曲的思想，是一种求解函数的方法，不仅仅适用于求解开方计算。当然使用牛顿法求解函数也存在很多坑，但对于求解开方而言，牛顿法是安全的。关于这一方法，你需要掌握一定的高等数学知识，想了解详细的内容，可以参考链接：如何通俗易懂地讲解牛顿迭代法求开方？数值分析？—马同学的回答

简单的理解，可以参考图片：

技术图片

图片来源：牛顿法与拟牛顿法

给定任意一个非负整数 (n)，我们想要找到一个 (x = lfloor sqrt{n} floor)，这相当于我们要计算函数 (f(x) = x^2 - n) 的根。我们首先需要先给出一个猜测值 (x_0)，不妨令 (x_0 = frac{x}{2} + 1)（证明见第一小节），然后在 (f(x_0)) 处作函数的切线，切线与 (x) 轴的交点，即为一次迭代后的值 (x_1)。若 (x_1) 不是要得到的结果，则继续迭代，在 (f(x_1)) 处作函数的切线，切线与 (x) 轴的交点，即为第二次迭代后的值 (x_2)。以此类推，直到得到 (x_n = lfloor sqrt{n} floor)。

现在我们来推导迭代式。对于 (x_i)，其函数值为 (f(x_i))，则对于点 ((x_i, f(x_i)))，可得其切线方程：

[ egin{align} &y - f(x_i) = f(x_i)^prime(x - x_i) \\[2ex] implies &y - (x_i^2 - n) = 2x_i(x - x_i) \\[2ex] implies &y + x_i^2 + n = 2x_ix end{align} ]

又因为 (x_{i+1}) 为切线与 (x) 轴的交点，所以令 (y=0)，可得：

[ x_{i+1} = (x_i + n / x_i) / 2 ]

现在，我们就可以根据迭代式编写代码了：

int sqrt(int x)
{
    // 避免除零错误，单独处理 x = 0 的情况
    if (x == 0)
        return x;
    int t = x / 2 + 1;
    while (t > x / t)
        t = (t + x / t) / 2;
    return t;
}

为了确保算法是正确的，我们还需要一些额外的证明。首先，证明迭代式是单调递减的：

[ x_{i+1} - x_i = leftlfloor frac{1}{2} (x_i + frac{n}{x_i}) ight floor - x_i = leftlfloor frac{1}{2} (frac{n}{x_i} - x_i) ight floor ]

可知，在区间 ([sqrt{x}, +infty)) 上，(x_{i+1} - x_i < 0)。

然后，我们还要证明迭代式是可以收敛到 (lfloor sqrt{n} floor) 的：

[ x_{i+1} = leftlfloor frac{1}{2} left( x_i + leftlfloor frac{n}{x_i} ight floor ight) ight floor = left lfloor frac{1}{2} (x_i + frac{n}{x_i}) ight floor geq left lfloor frac{1}{2} imes 2 imes sqrt{x_i cdot frac{n}{x_i}} ight floor = lfloor sqrt{n} floor ]

因此，当 while 循环结束时，我们可以得到正确的答案。

关于牛顿法求 sqrt(x) 的时间复杂度，笔者目前也没有搞清楚，有了解的童鞋欢迎交流~。不过通过查询资料，以及实际测试，可知牛顿法的时间效率优于二分搜索法。

以上是关于牛顿法和二分法精度上的区别的主要内容，如果未能解决你的问题，请参考以下文章

什么是牛顿法(Newton methods)？什么是拟牛顿法(Quasi Newton methods)？牛顿法和梯度下降法的区别是什么？