一些R语言的基本概念

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一些R语言的基本概念相关的知识,希望对你有一定的参考价值。

参考技术A 示例数据

① match
匹配两个向量,返回第二个向量在第一个向量匹配位置的下标志

② %in%
x%in%y: 判断x的每个元素在y中是否存在

③ merge

④ apply
apply(X, MARGIN, FUN, ...)
将一个函数同时作用于一个数组或者矩阵的一个margin(margin用来指定是对行运算还是对列运算,margin=1表示对行运算,margin=2表示对列运算),FUN用来指定运算函数;...用来指定FUN中需要的其它参数。

随机过程分析中的一些基本概念

 一、基本定义与概念

随机变量:
   令$(Omega , mathcal{F} , P)$是完备概率空间,随机变量$X: Omega ightarrow extbf{R}^n$是一个$mathcal{F}-$的一个可测映照。所有随机变量满足概率测度:
egin{equation}
mu_X(B)=P(X^{-1}(B))
end{equation}
其中$mu_X$称为随机变量$X$的分布


随机过程:
随机过程是一组定义在概率空间$(Omega , mathcal{F} , P)$上的随机变量${X_t}_{tin T}$的参数化集合,取值在$ extbf{R}^n$中,$ Tin left[ 0, infty ight )$\
固定$tin T$我们可以得到随机变量:
egin{equation}
omega o X_t(omega); qquad omega in Omega
end{equation}
固定$omega in Omega$我们可以得到函数:
egin{equation}
t o X_t(omega); qquad t in T
end{equation}
称它为$X_t$的轨道.
    我们认为$t$是时间,每一个$omega$是一个独立的试验,$X_t(omega)$代表在时间$t$时刻试验$omega$的结果,写成二元函数的形式为$X(t,omega)$。因此我们经常将随机过程看作两个变量的函数:
egin{equation}
(t,omega) o X(t,omega)quad T imes Omega o extbf{R}^n
end{equation}
也可以说,随机过程是可测空间$(( extbf{R}^n)^T,mathcal{B})$上的概率测度
其中$sigma$-代数$mathcal{B}$由集合${omega;omega(t_1) in F_1,cdots,omega(t_k)in F_k}$生成,$F_isubset extbf{R}^n$中的Borel集
  随机过程的有限维分布表示为:
egin{equation}
mu_{t_1,t_2,cdots,t_k}(F_1 imes F_2 imes cdots imes F_k)=P(X_{t_1}in F_1,cdots,X_{t_k} in F_k); t_i in T
end{equation}$F_1,...,F_k$表示$ extbf{R}^n$中的Borel集
  由kolmogorov相容性定理,给出一族概率测度满足相容性条件时,可构造一个随机过程,使其有限维分布满足这一族概率测度.

布朗运动:
  布朗运动最早是在1828年由苏格兰植物学家发现观察到花粉颗粒的一种不规则运动。这一运动后来被解释为液体分子的随机碰撞。用随机过程$B_t(omega)$来描述花粉粒$omega$在时间$t$处的位置。
  由 Kolmogorov 存在定理, 指定一族概率测度 $ {V_{_{t_{1}},...,t_{k}}} $,满足相容性条件。这一族概率测度与观察到的花粉的行为一致,就可以构造随机过程$ {B_{t}}_{tgeq0} $
固定$ xin extbf{R}^{n} $,定义:
egin{equation}
p(t,x,y)=((2pi t)^{-n/2})exp(-dfrac{|x-y|^2}{2t}),qquad yin extbf{R}^{n},t>0 
end{equation}
如果$ 0leq t_{1}leq t_{2}leq cdots leq t_{k} $,定义$ extbf{R}^{nk} $上的一个测度:
egin{equation}
v_{{t_{1}},...,t_{k}}(F_{1} imes ... imes F_{k} )\
=int_{F_{1} imes ... imes F_{k} }^{} p(t_{1},x,x_{1})p(t_{2}-t_{1},x_{1},x_{2})...p(t_{k}-t_{k-1},x_{k-1},x_{k})dx_{1}cdots dx_{k},
end{equation}
我们用符号$ dy=dy_{1}cdots dy_{k} $表示 Lebesgue 测度, $ p(0,x,y)dy=delta _{x}(y) $表示在$ x $处单位点的质量。
  将这一定义延拓到有限维空间,并利用Kolmogorov相容性定理,可以得到:
存在一个概率空间$(Omega , mathcal{F} , P)$与一个$Omega$上的随机过程$ {B_{t}}_{tgeq 0} $,其有限维分布为:
egin{equation}
P^{x}(B_{t_1}in F_{1},cdots , B_{t_k}in F_{K})\
=int_{F_{1} imes cdots imes F_{k} }^{} p(t_{1},x,x_{1})p(t_{2}-t_{1},x_{1},x_{2})cdots p(t_{k}-t_{k-1},x_{k-1},x_{k})dx_{1}cdots dx_{k}
end{equation}
这一随机过程称为初始为$x$的布朗运动。

  上述定义的布朗运动并不唯一,选取$omega in Omega$,连续函数$t o B_t(omega)$,从$left[ 0, infty ight )$映射到$ extbf{R}^n$,这样我们可以认为布朗运动是配备了上式给出的概率测度$P^x$的$C(left[ 0,infty ight) , extbf{R}^n)$空间


布朗运动的基本特征:
(i) $B_t$是高斯过程:
  对所有的$ 0leq t_{1}leq t_{2}leqcdotsleq t_{k} $随机变量$ Z=(B_{t_{1}},...,B_{t_{K}})in extbf{R}^{nk}$,服从 (多重) 正态分布\
(ii)$B_t$具有独立增量性:
  对任意的$ 0leq t_{1}leq t_{2}leq...leq t_{k} $,
$ B_{t_{1}},B_{t_{2}}-B_{t_{1}},cdots,B_{t_{k}}-B_{t_{k-1}} $是独立的。
(iii)$B_t$几乎处处连续:
  布朗运动轨道的连续性质由Kolmogorov 连续性定理给出:
  随机过程$X={X_t}_{tgeq0}$满足下列条件:
对于任意的$T>0$,存在连续正数$alpha,eta,D$,满足:
egin{equation}
E[|X_t-X_s|^{alpha}]leq Dcdot|t-s|^{1+eta};qquad 0leq s,tleq T
end{equation}
则存在随机过程X的连续形式。
由上述定理可知布朗运动满足Kolmogorov条件,因此存在连续形式,我们认为$B_t$为连续的


二、$Ithat{o}$积分

$Ithat{o}$积分的构造:

  用随机过程$W_t$替代微分方程里的噪声部分,可以得到以下形式的微分方程:
egin{equation}
frac{dN}{dt}=b(t,X_t)+sigma(t,X_t)cdot W_t
end{equation}
在多数应用场景下随机过程$W_t$满足需要以下条件:
(i)$W_{t_1}$与$W_{t_2}$独立,$t_1 ot = t_2$
(ii)$W_t$是固定的,即联合分布${W_{t_1+t},...,W_{t_k+t}}$不随t的变化而变化
(iii)对于所有$t$,$E[W_t]=0$
可证明满足上述条件的合理随机过程是不存在的,然而可以将$W_t$表示为一个广义随机过程,称为白噪声过程。

  考虑方程的离散情况:
egin{equation}
X_{k+1}-X_k=b(t_k,X_k)Delta t_k+sigma(t_k,X_k)W_k Delta t_k
end{equation}
其中:
egin{equation}
X_j=X(t_j)$,$W_k=W_{t_k},Delta t_k=t_{k+1}-t_k
end{equation}
将$W_k Delta t_k$替换为$Delta V_k=V_{t_{k+1}}-V_{t_k}$,当$W_t$满足上面三个条件时,$V_t$应当为平均值为0的独立平稳增量。由于只有一种随机过程——布朗运动满足连续轨迹,因此令$V_t=B_t$得到:
egin{equation}
X_k=X_0+displaystylesum_{j = 1}^{k-1}b(t_j,X_j)Delta t_j+displaystylesum_{j = 1}^{k-1}sigma(t_j,X_j)Delta B_j
end{equation}
当$Delta t_j o0$时右侧极限若存在,则$X_t=X_t(omega)$为满足下式的随机过程:
egin{equation}
X_k=X_0+displaystyleint_{0}^{t}b(s,X_s)ds+displaystyleint_{0 }^{t}sigma(s,X_s)d B_s
end{equation}
  构造阶梯函数可证明随机积分的存在性,定义积分$int_{S}^{T}f(t,omega)dB_t(omega)$为$displaystylesum_{j}^{S}f(t_j^*,omega)[B_{t_j+1}-B_{t_j}](omega)$当$n oinfty$时的极限形式。
1)当取左端点积分$t_j^*=t_j$时,为$Ithat{o}$积分,表示为
egin{equation}
int_{S}^{T}f(t,omega)dB_t(omega)
end{equation}
2)当取中点作积分$t_j^*=(t_j+t_{j+1})/2$时,为$Stratonovich$积分,表示为:
egin{equation}
int_{S}^{T}f(t,omega)circ dB_t(omega)
end{equation}
$Ithat{o}$积分保持了布朗运动的鞅性和独立增量性,$Stratonovich$积分在运算上可以有如$Riemann$积分中的链式法则

以上是关于一些R语言的基本概念的主要内容,如果未能解决你的问题,请参考以下文章

C语言基本概念

Moment-基本概念篇

人工智能领域的一些基本概念

RFS一些基本概念

随机过程分析中的一些基本概念

随机过程分析中的一些基本概念