条件期望误差的有限性

Posted 分析101

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了条件期望误差的有限性相关的知识,希望对你有一定的参考价值。

1 CEF error的有限性问题

在回归中,记条件期望函数conditional expectation functionCEF)为\\(E[Y|X=x]\\),则可将因变量\\(Y\\)分解为

\\[Y=E[Y|X=x]+e \\]

可记\\(e=Y-E[Y|X=x]\\)为条件期望函数误差(CEF error)。

显然,\\(e\\)满足\\(E[e|X]=0\\)\\(E[e]=0\\),这些都很容易证明。下面来看一个关于\\(e\\)的有限性的问题:

若对于\\(r\\gt 1\\)\\(E[|Y|^r]\\lt \\infty\\),求证\\(E[|e|^r]\\lt \\infty\\)

从直觉上说,\\(e\\)是用条件期望函数对\\(Y\\)做了解释后留下的残差,那么\\(Y\\)的有限性应该可以保证\\(e\\)的有限性。但要证明它,却比较复杂。

2 证明

首先我们利用Minkowski不等式,有

\\[\\begin{aligned} &\\left(E[|e|^r] \\right)^{1/r}\\\\ =& \\left(E\\left[|Y-E[Y|X=x]|^r\\right]\\right)^{1/r}\\\\ \\leq& \\left(E\\left[|Y|^r\\right]\\right)^{1/r}+\\left(E\\left[|E[Y|X=x]|^r\\right]\\right)^{1/r} \\end{aligned} \\]

由已知条件,第一项\\(\\left(E\\left[|Y|^r\\right]\\right)^{1/r}\\)是有限的。

对于第二项,由于\\(g(\\cdot)=|\\cdot|^r\\)\\(r\\geq 1\\)时为凸函数,由Jensen不等式\\(g(E[Y|X]) \\leq E[g(Y)|X]\\),即有

\\[|E[Y|X]|^r \\leq E[|Y|^r|X] \\]

再对两边取期望后取\\(1/r\\)次幂,可得

\\[\\left(E\\left[|E[Y|X]|^r \\right]\\right)^{1/r}\\leq \\left(E[|Y|^r]\\right)^{1/r} \\]

由已知条件可知,这一项也是有限的。

3 扩展

若我们关注\\(r=2\\),就变成了CEF error的无条件方差\\(\\sigma=E[e^2]=\\text{Var}[e]\\)。结论重新表述如下:

\\(E[Y^2]\\lt \\infty\\),则\\(\\sigma^2\\lt \\infty\\)

事实上,若对于多个解释变量,则不断加入解释变量后,残差的方差必将减小,即若\\(E[Y^2]\\lt \\infty\\),必有

\\[\\text{Var}[Y]\\geq \\text{Var}[Y-E[Y|X_1]] \\geq \\text{Var}[Y-E[Y|X_1,X_2]] \\]

为什么?

证明:先利用\\(E[Y|X_1]=E[E[Y|X_1,X_2]|X_1]\\)和Jensen不等式,我们可以得到

\\[\\left(E[Y|X_1]\\right)^2=(E[E[Y|X_1,X_2]|X_1])^2\\leq E[\\left(E[Y|X_1,X_2]\\right)^2|X_1] \\]

两边取期望后有

\\[E\\left[\\left(E[Y|X_1]\\right)^2\\right] \\leq E\\left[\\left(E[Y|X_1,X_2]\\right)^2\\right] \\]

同理,利用\\(E[Y]=E[E[Y|X_1]]\\)和Jensen不等式,可得到\\((E[Y])^2\\leq E\\left[\\left(E[Y|X_1]\\right)^2\\right]\\),与上面的式子放在一起有

\\[(E[Y])^2\\leq E\\left[\\left(E[Y|X_1]\\right)^2\\right] \\leq E\\left[\\left(E[Y|X_1,X_2]\\right)^2\\right] \\]

三个地方都同时减去\\((E[Y])^2\\),可得

\\[0 \\leq \\text{Var}\\left[E[Y|X_1]\\right] \\leq \\text{Var}\\left[E[Y|X_1,X_2]\\right] \\]

另一方面,我们已有\\(e=Y-E[Y|X]\\),再记\\(u=E[Y|X]-E[Y]\\),则\\(E[eu]=0\\),因此

\\[\\begin{aligned} &\\text{Var}[Y]\\\\ =& \\text{Var}[e+u]\\\\ =& \\text{Var}[e]+\\text{Var}[u]\\\\ =& \\text{Var}[Y-E[Y|X]]+\\text{Var}[E[Y|X]] \\end{aligned} \\]

\\(\\text{Var}[Y]\\)为常数,因此,\\(\\text{Var}[E[Y|X]]\\)越大,\\(\\text{Var}[Y-E[Y|X]]\\)越小,即

\\[\\text{Var}[Y]\\geq \\text{Var}[Y-E[Y|X_1]] \\geq \\text{Var}[Y-E[Y|X_1,X_2]] \\]

以上是关于条件期望误差的有限性的主要内容,如果未能解决你的问题,请参考以下文章

模型的泛化误差

[python基础] 浮点数乘法的误差问题

数值计算中的有限差分法

回归模型中随机误差项产生的原因是啥

机器学习(ML)七之模型选择欠拟合和过拟合

Task03 打卡