学数学有个球用?
Posted 陆嵩
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学数学有个球用?相关的知识,希望对你有一定的参考价值。
学数学有个球用?
我们学数学的,不能有丝毫的骄傲,却要有无比的自信。仅以此文致敬中国科学院数学与系统科学研究院的 2021 届毕业生们。
学好了数学,你能找一份工作,找到了一份不错的工作,你就有钱了,你有钱了,就可以买各种各样的球,足球篮球羽毛球,网球棒球羽毛球,手球水球曲棍球,桌球排球扔链球。结论是,学数学当然有球用,想要什么球都有,想要多少有多少。
学数学不仅有球用,还有卵用,鸡卵鸭卵鹅卵鱼卵,要什么卵,就有什么卵。
且自嘲地开个玩笑罢了。事实上,在工业生产生活中,随着科技的发展,人们原来越发现数学的重要性。在很多实际的科学和工业生产问题,都能提炼出很多数学问题,当生产人员解决不了这些数学问题时,他们便寄希望于有懂数学的人能够帮助他们解决这些问题。科技水平的提高,不那么数学的问题一一被解决,最后卡脖子的,变成了一些悬而未决的数学问题,这使得数学越来越受到重视,应用数学生们,也越来越被业界需要。
举个例子。
如何调好收音机
AFBT 算法
某天,软件工程师小李跟张师傅吐槽工作。小李主要研究和设计算法用于调节各种产品的参数。 这样的参数一般可以通过极小化 R n \\mathbb{R}^{n} Rn 上的某个损失函数 f f f 求得。在小李最近的一个项目中, 这个损失函数是另外一个课题组提供的。出于安全考虑和技术原因,该课题组难以向小李给出此函数的内部细节,而只能提供一个接口用于计算任意 x ∈ R n \\mathbf{x} \\in \\mathbb{R}^{n} x∈Rn 处的函 数值 f ( x ) f(\\mathbf{x}) f(x) 。 所以, 小李必须仅基于函数值来极小化 f f f 。而且, 每次计算 f f f 的值都消耗不小的计算资源。好在该问题的维度 n n n 不是很高 ( 10 (10 (10 左右 ) ) ) 。另外, 提供函数的同事还告知小李不妨先假设 f f f 是光滑的。
这个问题让张师傅想起了自己收藏的一台古董收音机。要在这台收音机上收听一 个节目, 你需要小心地来回宁一个调频旋钮, 同时注意收音效果,直到达到最佳。在这过程中, 没有人确切地知道旋钮的角度和收音效果之间的定量关系是什么。张师傅和小李意识到,极小化 f f f 不过就是调节一台有多个旋钟的机器:想象 x \\mathrm{x} x 的每一个分量由一个旋钮控制,而 f ( x ) f(\\mathbf{x}) f(x) 表示这台机器的某种性能,只要我们来回调整每个旋钮, 同时监视 f f f 的值, 应该就有希望找到最佳的 x \\mathbf{x} x 。受此启发, 两人一起提出了极小化 f f f 的一个迭代算法,并命名为“自动前后调整算法" (Automated Forward/Backward Tuning, AFBT, 算法 1 )。
在第 k k k 次迭代中, A F B T \\mathrm{AFBT} AFBT 通过前后调整 x k \\mathbf{x}_{k} xk 的单个分量得到 2 n 2 n 2n 个点 { x k ± t k e i : i = 1 , … , n } \\left\\{\\mathbf{x}_{k} \\pm t_{k} \\mathbf{e}^{i}: i=1, \\ldots, n\\right\\} {xk±tkei:i=1,…,n}, 其中 t k t_{k} tk 为步长。 然后, 令 y k \\mathbf{y}_{k} yk 为这些点中函数值最小的一个, 并检查 y k \\mathbf{y}_{k} yk 是否使 f f f 充分减小。若是, 取 x k + 1 = y k \\mathbf{x}_{k+1}=\\mathbf{y}_{k} xk+1=yk, 并将步长增倍,否则,令 x k + 1 = x k \\mathbf{x}_{k+1}=\\mathbf{x}_{k} xk+1=xk 并将步长减半。在算法 1 中, e i \\mathbf{e}^{i} ei 表示 R n \\mathbb{R}^{n} Rn 中的第 i i i 个坐标向量, 它 的第 i i i 个分量为 1, 其余皆为 0。 1 ( ⋅ ) \\mathbb{1}(\\cdot) 1(⋅) 为指示函数,即,若 f ( x k ) − f ( y k ) f\\left(\\mathbf{x}_{k}\\right)-f\\left(\\mathbf{y}_{k}\\right) f(xk)−f(yk) 至少为 t k t_{k} tk 之平 方, 则 1 [ f ( x k ) − f ( y k ) ≥ t k 2 ] \\mathbb{1}\\left[f\\left(\\mathbf{x}_{k}\\right)-f\\left(\\mathbf{y}_{k}\\right) \\geq t_{k}^{2}\\right] 1[f(xk)−f(yk)≥tk2] 取值为 1, 否则为 0 。
收敛性分析
为什么上面的调收音机的方法是 work 的?这时候,应用数学家上场了。
现在, 我们对损失函数 f : R n → R f: \\mathbb{R}^{n} \\rightarrow \\mathbb{R} f:Rn→R 作出如下假设。
- 假设 1.
f
f
f 为凸函数, 即对任何
x
,
y
∈
R
n
\\mathbf{x}, \\mathbf{y} \\in \\mathbb{R}^{n}
x,y∈Rn 与
α
∈
[
0
,
1
]
\\alpha \\in[0,1]
α∈[0,1] 都有
f ( ( 1 − α ) x + α y ) ≤ ( 1 − α ) f ( x ) + α f ( y ) f((1-\\alpha) \\mathbf{x}+\\alpha \\mathbf{y}) \\leq(1-\\alpha) f(\\mathbf{x})+\\alpha f(\\mathbf{y}) f((1−α)x+αy)≤(1−α)f(x)+αf(y) - 假设 2. f f f 在 R n \\mathbb{R}^{n} Rn 上可微且 ∇ f \\nabla f ∇f 在 R n \\mathbb{R}^{n} Rn 上 L L L -Lipschitz 连续。
- 假设 3. f f f 的水平集有界,即对任意 λ ∈ R \\lambda \\in \\mathbb{R} λ∈R, 集合 { x ∈ R n : f ( x ) ≤ λ } \\left\\{\\mathrm{x} \\in \\mathbb{R}^{n}: f(\\mathbf{x}) \\leq \\lambda\\right\\} {x∈Rn:f(x)≤λ} 皆有界。
基于假设 1 与假设 2 , 可以证明
⟨
∇
f
(
x
)
,
y
−
x
⟩
≤
f
(
y
)
−
f
(
x
)
≤
⟨
∇
f
(
x
)
,
y
−
x
⟩
+
L
2
∥
x
−
y
∥
2
\\langle\\nabla f(\\mathbf{x}), \\mathbf{y}-\\mathbf{x}\\rangle \\leq f(\\mathbf{y})-f(\\mathbf{x}) \\leq\\langle\\nabla f(\\mathbf{x}), \\mathbf{y}-\\mathbf{x}\\rangle+\\frac{L}{2}\\|\\mathbf{x}-\\mathbf{y}\\|^{2}
⟨∇f(x),y−x⟩≤f(y)−f(x)≤⟨∇f(x),y−x⟩+2L∥x−y∥2
对任何
x
,
y
∈
R
n
\\mathbf{x}, \\mathbf{y} \\in \\mathbb{R}^{n}
x,y∈Rn 成立; 假设 1 与假设 3 则保证
f
f
f 在
R
n
\\mathbb{R}^{n}
Rn 上取到有限的最小值
f
∗
f^{*}
f∗ 。凸 函数的更多性质可参考任何一本凸分析教科书。
在假设
1
−
3
1-3
1−3 下, 对于
A
F
B
T
\\mathrm{AFBT}
AFBT, 我们可以证明 以上是关于学数学有个球用?的主要内容,如果未能解决你的问题,请参考以下文章
lim
k
→
∞
f
(
x
k
)
=
f
∗
\\lim _{k \\ri