现代精算风险理论03:聚合风险模型
Posted 这个XD很懒
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了现代精算风险理论03:聚合风险模型相关的知识,希望对你有一定的参考价值。
第三讲 聚合风险模型
第一节 聚合风险的分布
一、定义和假设
一般聚合风险模型需要考虑时间的因素,因此也往往会考虑利率的因素。为了简化模型,本节虽然考虑在某个时间段内理赔总额的分布函数,但不考虑利率的因素。
聚合风险模型把风险组合理解为在一定时间段内产生的随机多个理赔的全体,定义
其中 \\(N\\) 表示理赔次数,\\(X_i\\ (i=1,2,\\cdots,N)\\) 表示第 \\(i\\) 个理赔额。约定当 \\(N=0\\) 时,\\(S_N=0\\) 。
聚合风险模型其本质是随机变量的随机和,或者说是一个复合分布。聚合风险模型和个体风险模型的差异主要有以下两点:
- 在个体风险模型中 \\(X_i\\) 可能为 \\(0\\) ,在聚合风险模型中一般 \\(X_i>0\\) ;
- 在个体风险模型中理赔次数 \\(n\\) 是确定值,在聚合风险模型中理赔次数 \\(N\\) 是一个随机变量。
聚合风险模型的基本假设为:
- 个体理赔额 \\(X_i\\ (i=1,2,\\cdots,N)\\) 是独立同分布的,记为与 \\(X\\) 同分布。
- 索赔次数 \\(N\\) 是取值为自然数的离散型随机变量。特别地,
- 当 \\(N\\) 服从泊松分布时,称 \\(S_N\\) 服从复合泊松分布;
- 当 \\(N\\) 服从二项分布时,称 \\(S_N\\) 服从复合二项分布;
- 当 \\(N\\) 服从负二项分布时,称 \\(S_N\\) 服从复合负二项分布;
- 当 \\(N\\) 服从几何分布时,称 \\(S_N\\) 服从复合几何分布。
- 个体理赔额 \\(X_i\\ (i=1,2,\\cdots,N)\\) 与索赔次数 \\(N\\) 相互独立。
二、聚合风险的数字特征
对于聚合风险模型的总理赔额 \\(S_N\\) 和个体理赔额 \\(X_i\\ (i=1,2,\\cdots,N)\\) ,记
利用全期望公式和方差分解准则可以计算总理赔额 \\(S_N\\) 的期望、方差和矩母函数:
全期望公式:
\\[\\mathbbE(W)=\\mathbbE[\\mathbbE(W|V)]. \\]方差分解准则:
\\[\\rm Var(W)=\\rm Var[\\mathbbE(W|V)]+\\mathbbE[\\rm Var(W|V)]. \\]
计算 \\(S_N\\) 的期望:
计算 \\(S_N\\) 的方差:
计算 \\(S_N\\) 的矩母函数:
例如:复合几何分布的分布函数
假设理赔次数 \\(N\\sim G(p), \\ 0<p<1\\) ,随机变量 \\(X\\sim \\mathrmExp(\\theta)\\) 。求该复合几何分布 \\(S_N\\) 的分布。
解题思路:首先计算 \\(S_N\\) 的矩母函数,然后尝试通过矩母函数来确定该复合分布。
由 \\(N\\sim G(p)\\) 可知,记 \\(q=1-p\\) ,当 \\(q e^t<1\\) 时,即当 \\(t<-\\log q\\) 时,
\\[m_N(t)=\\sum_n=0^\\infty e^tnpq^n=\\fracp1-qe^t. \\]由 \\(X\\sim \\mathrmExp(\\theta)\\) 可知
\\[m_X(t)=\\frac\\theta\\theta-t \\ , \\quad 0<t<\\theta. \\]所以 \\(S_N\\) 的矩母函数为
\\[\\beginaligned m_S(t)&=m_N(\\log m_X(t)) \\\\ \\\\ &=\\fracp1-qm_X(t) \\\\ \\\\ &=\\fracp1-\\dfracq\\theta\\theta-t \\\\ \\\\ &=\\fracp(\\theta-t)\\theta p-t \\\\ \\\\ &=p+q\\frac\\theta p\\theta p-t. \\endaligned \\]可见 \\(S_N\\) 的矩母函数是常数 \\(0\\) 的矩母函数与 \\(\\rm Exp(\\theta p)\\) 分布的矩母函数的一个混合。
由分布函数与矩母函数之间的一一对应关系可知,\\(S_N\\) 的分布函数也具有同样的混合结构:
\\[S_N\\xlongequaldIX+(1-X)Y. \\]其中 \\(I\\sim B(1,p), \\ X=0 , \\ Y\\sim \\mathrmExp(\\theta p)\\) 。于是 \\(S_N\\) 的分布函数为
\\[F(x)=p+q(1-e^-\\theta px)=1-qe^-\\theta px , \\quad x\\geq0. \\]分布函数 \\(F(x)\\) 在 \\(0\\) 点有跳跃,高度为 \\(p\\) ,而当 \\(x>0\\) 时,\\(F(x)\\) 服从指数分布。
三、复合泊松分布
复合泊松分布的数字特征
假设理赔次数 \\(N\\sim P(\\lambda)\\) ,随机变量 \\(X\\) 的各阶矩记为 \\(\\mathbbE(X^k)=\\mu_k\\) ,矩母函数记为 \\(m_X(t)\\) 。
复合泊松分布 \\(S_N\\) 的均值和方差:
复合泊松分布 \\(S_N\\) 的矩母函数:
复合泊松分布 \\(S_N\\) 的累积量母函数:
复合泊松分布 \\(S_N\\) 的三阶中心矩:
复合泊松分布的近似分布
设 \\(S_N\\) 服从复合泊松分布,其参数为 \\(\\lambda\\) ,记理赔额 \\(X\\) 的 \\(k\\) 阶矩为 \\(\\mu_k\\) ,则有
复合泊松分布的中心极限定理:
复合泊松分布的平移伽马近似:
复合泊松分布的 NP 近似:
当 \\(s\\geq1\\) 时,
当 \\(x\\geq1\\) 时,
定理(复合泊松分布的和仍是复合泊松分布)如果 \\(S_1,S_2,\\cdots,S_m\\) 是一列独立的复合泊松分布的随机变量,分别具有参数 \\(\\lambda_i\\) 和理赔分布 \\(P_i(x)\\ (i=1,2,\\cdots,m)\\) ,那么 \\(S=S_1+S_2+\\cdots+S_m\\) 仍是一个复合泊松分布的随机变量,其参数和理赔分布分别为
设 \\(m_i(x)\\) 是 \\(P_i(x)\\) 的矩母函数,则 \\(S\\) 的矩母函数为
\\[m_S(t)=\\prod_i=1^m\\exp\\left\\\\lambda_i\\left[m_i(t)-1\\right]\\right\\=\\exp\\left\\\\lambda\\left[\\sum_i=1^m\\frac\\lambda_i\\lambdam_i(t)-1\\right]\\right\\. \\]故 \\(S\\) 是一个复合泊松随机变量。
该定理常用于解释以下两个情景:
- 对任意 \\(m\\) 个独立复合泊松风险组合,其总和仍然服从复合泊松分布;
- 对同一个复合泊松风险组合观测 \\(m\\) 年且假设每年的结果相互独立,则 \\(m\\) 年结果的总和仍然服从复合泊松分布。
定理(理赔次数服从独立泊松分布) 假设 \\(S\\) 服从参数为 \\(\\lambda\\) 的复合泊松分布,其中理赔分布是一个离散型分布,且满足
如果 \\(S\\) 可以表示成
其中 \\(N_i\\) 表示理赔额 \\(x_i\\) 的发生次数,则 \\(N_1,N_2,\\cdots,N_m\\) 构成一列独立的 \\(P(\\lambda\\pi_i)\\ (i=1,2,\\cdots,m)\\) 随机变量。
引理:多项分布
某随机试验有 \\(k\\) 个可能的结果 \\(A_1,A_2,\\cdots,A_k\\) ,它们可能出现的概率分别为 \\(p_1,p_2,\\cdots,p_k\\) 。将它们出现的次数记为随机变量 \\(X_1,X_2,\\cdots,X_k\\) 。
在 \\(n\\) 次试验结果中,\\(A_i\\) 出现 \\(n_i\\) 次 \\((i=1,2,\\cdots,k)\\) ,其中 \\(n_1+n_2+\\cdots+n_k=n\\) ,这种事件发生的概率为
\\[\\mathrmPr(X_1=n_1,X_2=n_2,\\cdots,X_k=n_k)=\\fracn!n_1!n_2!\\cdots n_k!p_1^n_1p_2^n_2\\cdots p_k^n_k. \\]随机向量 \\((X_1,X_2,\\cdots,X_k)\\) 的分布称为多项分布,记为 \\(M(n,p_1,p_2,\\cdots,p_k)\\) 。
记 \\(N=N_1+N_2+\\cdots+N_m\\) 和 \\(n=n_1+m_2+\\cdots+n_m\\) ,对 \\(N=n\\) 取条件得
\\[(N_1,N_2\\cdots,N_m|N=n)\\sim M(n,\\pi_1,\\pi_2,\\cdots,\\pi_m) , \\]于是
\\[\\beginaligned &\\mathrmPr(N_1=n_1,N_2=n_2,\\cdots,N_m=n_m) \\\\ \\\\ =\\; & \\mathrmPr(N_1=n_1,N_2=n_2,\\cdots,N_m=n_m|N=n)\\mathrmPr(N=n) \\\\ \\\\ =\\; & \\fracn!n_1!n_2!\\cdots n_m!\\pi_1^n_1\\pi_2^n_2\\cdots \\pi_m^n_m e^-\\lambda\\frac\\lambda^nn! \\\\ \\\\ =\\; &\\prod_i=1^me^-\\lambda\\pi_i\\frac(\\lambda\\pi_i)^n_in_i! \\\\ \\\\ =\\; &\\mathrmPr(N_1=n_1)\\mathrmPr(N_2=n_2)\\cdots\\mathrmPr(N_m=n_m). \\endaligned \\]所以 \\(N_i\\sim P(\\lambda\\pi_i), \\ i=1,2,\\cdots,m\\) 且相互独立。
第二节 Panjer 递推
一、Panjer 递推的定义
定理(Panjer 递推)考虑这样一个复合分布,满足:
(1) 理赔额 \\(X_k\\ (k\\geq1)\\) 独立同分布,取值为自然数,且具有 \\(\\mathrmPr(X=x)=p(x), \\ x=0,1,2,\\cdots\\) ;
(2) 理赔次数 \\(N\\) 属于 \\((a,b,0)\\) 族,即对于实数 \\(a\\) 和 \\(b\\) ,事件”有 \\(n\\) 个理赔发生“的概率 \\(q_n=\\mathrmPr(N=n)\\) 满足如下的递推关系式:
则事件“总理赔额等于 \\(s\\) “的概率 \\(f(s)=\\mathrmPr(S_N=s)\\) 满足如下的关系式:
(1) 计算初始值 \\(f(0)\\) :
\\[f(0)=\\mathrmPr(S=0)=\\sum_n=0^\\infty\\mathrmPr(N=n)\\left[p(0)\\right]^n. \\]当 \\(p(0)=0\\) 时,
\\[f(0)=\\mathrmPr(S=0)=\\mathrmPr(N=0). \\]当 \\(p(0)>0\\) 时,
\\[f(0)=\\mathrmPr(S=0)=\\sum_n=0^\\infty\\mathrmPr(N=n)\\left[p(0)\\right]^n=m_N(\\log p(0)). \\](2) 记 \\(T_k=X_1+X_2+\\cdots+X_k,\\ k\\geq1, \\ T_0=0\\) 。 由对称性可得
\\[\\mathbbE\\left[X_1|T_k=s\\right]=\\fracsk, \\]所以
\\[\\mathbbE\\left[a+\\fracbX_1s\\bigg|T_k=s\\right]=a+\\fracbk. \\](3) 另一方面,
\\[\\beginaligned \\mathbbE\\left[a+\\fracbX_1s\\bigg|T_k=s\\right]&=\\sum_h=0^s\\left( a+\\fracbhs\\right)\\mathrmPr(X_1=h|T_k=s) \\\\ \\\\ &=\\sum_h=0^s\\left( a+\\fracbhs\\right)\\frac\\mathrmPr(X_1=h,T_k=s)\\mathrmPr(T_k=s) \\\\ \\\\ &=\\sum_h=0^s\\left( a+\\fracbhs\\right)\\frac\\mathrmPr(X_1=h)\\mathrmPr(T_k-X_1=s-h)\\mathrmPr(T_k=s). \\endaligned \\]所以
\\[\\left(a+\\fracbk\\right)\\mathrmPr(T_k=s)=\\sum_h=0^s\\left( a+\\fracbhs\\right)\\mathrmPr(X_1=h)\\mathrmPr(T_k-X_1=s-h). \\](4) 对任意的 \\(s=1,2,\\cdots\\) ,有
\\[\\beginaligned f(s)&=\\sum_k=1^\\infty q_k\\mathrmPr(T_k=s) \\\\ \\\\ &=\\sum_k=1^\\infty q_k-1\\left(a+\\frac bk\\right)\\mathrmPr(T_k=s) \\\\ \\\\ &=\\sum_k=1^\\infty q_k-1\\sum_h=0^s\\left(a+\\fracbhs\\right)\\mathrmPr(X_1=h)\\mathrmPr(T_k-X_1=s-h) \\\\ \\\\ &=\\sum_h=0^s\\left(a+\\fracbhs\\right)\\mathrmPr(X_1=h)\\sum_k=1^\\infty q_k-1\\mathrmPr(T_k-X_1=s-h) \\\\ \\\\ &=\\sum_h=0^s\\left(a+\\fracbhs\\right)p(h)\\sum_k=1^\\infty q_k-1\\mathrmPr(T_k-1=s-h) \\\\ \\\\ &=\\sum_h=0^s\\left(a+\\fracbhs\\right)p(h)f(s-h) \\\\ \\\\ &=ap(0)f(s)+\\sum_h=1^s\\left(a+\\fracbhs\\right)p(h)f(s-h). \\endaligned \\]由此即可解得 Panjer 递推
\\[f(s)=\\frac11-ap(0)\\sum_h=1^s\\left(a+\\fracbhs\\right)p(h)f(s-h),\\quad s=1,2,\\cdots. \\]
利用 Panjer 递推计算 \\(S_N\\) 的概率分布列的优点在于它避免了卷积的计算,但一般来说,\\(S_N\\) 的概率分布列的递推公式不存在,只有很少的一些分布满足递推关系式。
对于 Panjer 递推存在的 \\(S_N\\) ,其任意阶矩也可以通过 Panjer 递推进行计算。对于 \\(r=1,2,\\cdots\\) ,有
利用二项展开,有
因此,有
由于 \\(\\sum_k=1^\\infty f_k=1-f_0\\) ,对上述等式进行整理可得
二、复合泊松分布的 Panjer 递推
对于 \\(N\\sim P(\\lambda)\\) ,有 \\(a=0,\\ b=\\lambda\\geq0\\) ,并且递推关系可以被简化为
利用 Panjer 递推公式也可以求复合泊松分布的前三阶矩:
由此也可以推出
第三节 停止损失保费
一、停止损失保费的定义
在保险实务中,为了促使投保人有自我防灾意识,以减少不必要的损失,通常不是全额承包。保险合同规定的赔付额通常低于实际损失。由于理赔额是损失的函数,故常记为 \\(I(X)\\) ,满足 \\(0\\leq I(X)\\leq X\\) 。
有一种简单但特别重要的形式为
其中 \\(d\\) 称为免赔额。它的意义是当损失低于免赔额 \\(d\\) 时不予理赔,只有超过 \\(d\\) 的部分才予以理赔,其理赔额为 \\(X-d\\) 。这种形式称为停止损失。
对于停止损失保险合同,其纯保费为 \\(\\mathbbE\\left[(X-d)_+\\right]\\) 称为停止损失保费,记为 \\(\\pi_X(d)=\\mathbbE\\left[(X-d)_+\\right]\\) 。由于停止损失保费是免赔额 \\(d\\) 的函数,故也称为停止损失函数。
若风险 \\(X\\) 是连续型随机变量,其密度函数为 \\(f_X(x)\\) ,假设 \\(\\mathbbE(X)<\\infty\\) ,则停止损失保费为
记 \\(F_X(x)\\) 为随机变量 \\(X\\) 的分布函数,记 \\(\\barF_X(x)=1-F(x)\\) 为生存函数,则有
若风险 \\(X\\) 是连续型随机变量,并且在 \\(x\\) 处有概率为 \\(f_X(x)\\) ,则停止损失保费为
如果 \\(X\\) 在 \\(x_1<x_2<\\cdots<x_k<d<x_k+1<\\cdots\\) 处有概率,记分布函数 \\(F_X(x)=\\mathrmPr(X\\leq x)\\) ,则有
对于任意的风险 \\(X\\) ,其停止损失函数可以统一表示为
由停止损失函数可得
可以证明停止损失函数与分布函数构成一一对应关系,即两个风险具有相同的停止损失函数,则必有相同的分布函数,反之亦然。
对于任意停止损失函数,满足如下三个条件:
- 停止损失函数 \\(\\pi_X(d)\\) 是一个连续函数;
- 停止损失函数 \\(\\pi_X(d)\\) 关于 \\(d\\) 严格递减;
- \\(\\pi_X(0)=\\mathbbE(X), \\ \\pi_X(\\infty)=0\\) 。
如果存在一个函数 \\(\\pi(\\cdot)\\) 满足以上三个性质,则称为停止损失函数,并且一定存在一个随机变量 \\(X\\) ,其停止损失函数恰好为 \\(\\pi(\\cdot)\\) 。
二、Panjer 递推与停止损失保费
对于一个整值随机变量 \\(S\\) ,其停止损失保费可以表示为
利用 Panjer 递推,停止损失保费也可以通过递推求得,对整数 \\(d\\geq0\\) ,有
假设 \\(S\\) 服从复合泊松分布,\\(N\\sim P(1)\\) ,其中 \\(X_i\\) 为两点分布
\\[p(1)=p(2)=\\frac12. \\]给出停止损失保费的递推公式。
复合泊松分布的 Panjer 递推如下:
\\[\\beginaligned &f(0)=e^-\\lambda(1-p(0)), \\\\ \\\\ &f(s)=\\frac1s\\sum_h=1^s\\lambda hp(h)f(s-h), \\quad s=1,2,\\cdots. \\endaligned \\]由题意知 \\(\\lambda=1,\\ p(0)=0\\) ,因此
\\[\\beginaligned &f(0)=e^-1, \\\\ \\\\ &f(1)=\\frac12f(0)=\\frac12e^-1 , \\\\ \\\\ &f(x)=\\frac1x\\left[\\frac12f(x-1)+f(x-2)\\right], \\quad x=2,3,\\cdots. \\endaligned \\]由题意知 \\(\\mu_1=\\mathbbE(X_1)=\\dfrac32\\) ,初始值为
\\[\\beginaligned &f(0)=e^-1, \\quad F(0)=f(0), \\quad \\pi(0)=\\mathbbE(S)=\\lambda\\mu_1=\\frac32. \\endaligned \\]由递推公式可以得出 \\(F(x)\\) 和 \\(\\pi(d)\\) 的值。
三、案例
正态分布的停止损失保费:设 \\(S\\sim N(\\mu,\\sigma^2)\\) ,考虑 \\(S\\) 的取自留额 \\(d\\) 的停止损失保费。
如果 \\(Z\\sim N(0,1)\\) ,则 \\(S\\xlongequald\\sigma Z+\\mu\\sim N(\\mu,\\sigma^2)\\) ,于是所要计算的停止损失保费为
因此,先考虑特殊情形 \\(\\mu=0\\) 和 \\(\\sigma^2=1\\) ,即标准正态分布情形。
因为 \\(\\phi\'(u)=-u\\phi(u)\\) ,所以有
于是可以得到
从而有
伽马分布的停止损失保费:设 \\(S\\sim \\Gamma(\\alpha,\\beta)\\) ,用 \\(G(x;\\alpha,\\beta)\\) 表示 \\(S\\) 的分布函数。考虑 \\(S\\) 的取自留额 \\(d\\) 的停止损失保费。记 \\(\\barG(x;\\alpha,\\beta)=1-G(x;\\alpha,\\beta)\\) 为 \\(\\Gamma(\\alpha,\\beta)\\) 的生存函数。\\
停止损失保费的 NP 近似:对于某些随机变量 \\(X\\) ,当 \\(y>1\\) 时,随机事件 \\(\\X>y\\\\) 的概率用 NP 近似效果较好。考虑对 \\(X\\) 的停止损失保费,即 \\(\\mathbbE\\left[(X-d)_+\\right]\\) 的给出 NP 近似。
对 \\(u\\geq1\\) 和 \\(y\\geq1\\) ,定义辅助函数:
易知 \\(w(q(u))=u\\) 和 \\(q(w(y))=y\\) ,进一步可知 \\(q(\\cdot)\\) 和 \\(w(\\cdot)\\) 都是单调递增函数,并且
例如:设 \\(Z\\) 是一个均值为 \\(0\\) ,标准差为 \\(1\\) ,偏度为 \\(\\gamma>0\\) 的随机变量,采用 NP 近似来计算停止损失保费。
由 NP 近似可知
\\[\\mathrmPr(Z>q(u))=\\mathrmPr(w(Z)>u)\\approx 1-\\Phi(u),\\quad u\\geq1. \\]设 \\(U\\sim N(0,1)\\) ,定义随机变量 \\(V=\\max\\q(U),1\\\\) 。
由于 \\(q(1)=1\\) 且 \\(q(\\cdot)\\) 单调,因此当 \\(U\\geq1\\) 时,有 \\(q(U)\\geq1\\) ,所以
\\[\\mathrmPr(V>q(u))=\\mathrmPr(U>u)=1-\\Phi(u),\\quad u\\geq1. \\]由此可得
\\[\\mathrmPr(Z>q(u))\\approx 1-\\Phi(u)=\\mathrmPr(V>q(u)),\\quad u\\geq1. \\]当 \\(d\\geq1\\) 时,停止损失保费可以通过 \\(V\\) 的停止损失保费来近似,即
\\[\\beginaligned \\mathbbE\\left[(Z-d)_+\\right]&=\\int_d^\\infty\\mathrmPr(Z>y)\\mathrmdy \\\\ \\\\ &\\approx\\int_d^\\infty\\mathrmPr(V>y)\\mathrmdy=\\mathbbE\\left[(V-d)_+\\right] \\\\ \\\\ &=\\int_-\\infty^\\infty\\left(\\max\\q(u),1\\-d\\right)_+\\phi(u)\\mathrmdu \\\\ \\\\ &=\\int_w(d)^\\infty(q(u)-d)\\phi(u)\\mathrmdu. \\endaligned \\]最后一个等式用到了 \\(q(u)\\geq y \\ \\ \\iff \\ \\ w(y)\\leq u\\) 。
为了计算上面的积分,需要利用如下的结果:
\\[\\phi\'(u)=-u\\phi(u), \\\\ \\\\ \\frac\\mathrmd\\mathrmdu[u\\phi(u)]=(1-u^2)\\phi(u) \\quad \\Longrightarrow \\quad \\int_t^\\infty[u^2-1]\\phi(u)\\mathrmdu=t\\phi(t). \\]由此可得
\\[\\beginaligned \\mathbbE\\left[(Z-d)_+\\right]&\\approx \\int_w(d)^\\infty(q(u)-d)\\phi(u)\\mathrmdu \\\\ \\\\ &= \\int_w(d)^\\infty\\left[u+\\frac\\gamma6(u^2-1)-d\\right]\\phi(u)\\mathrmdu \\\\ \\\\ &=\\phi(w(d))+\\frac\\gamma6w(d)\\phi(w(d))-d[1-\\Phi(w(d))]. \\endaligned \\]这个公式可用于任何一个满足期望为 \\(0\\) ,方差为 \\(1\\) ,偏度为 \\(\\gamma>0\\) 的风险变量 \\(Z\\) 的停止损失保费的近似公式。
以上是关于现代精算风险理论03:聚合风险模型的主要内容,如果未能解决你的问题,请参考以下文章
R语言广义线性模型索赔频率预测:过度分散风险暴露数和树状图可视化