R语言用CPV模型的房地产信贷信用风险的度量和预测|附代码数据
Posted 大数据部落
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言用CPV模型的房地产信贷信用风险的度量和预测|附代码数据相关的知识,希望对你有一定的参考价值。
全文链接:http://tecdat.cn/?p=30401
最近我们被客户要求撰写关于CPV模型的研究报告,包括一些图形和统计输出。
本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。我们被客户要求撰写关于CPV模型的研究报告
结果表明, 该模型在度量和预测房地产信贷违约率方面具有较好的效果。
CPV 模型的基本原理和框架
CPV 模型是一个用于分析贷款组合风险和收益的多因素模型, 它根据失业率、长期利率、GDP 增长率、汇率、政府支出和总储蓄率等宏观因素, 借助于经济计量工具和蒙特卡罗技术, 将每个国家不同行业中不同等级的违约概率和转移概率相联系, 进而计算出风险价值( 迪迪埃、皮罗特, 2005) 。
指标及样本数据选择
当实际运用 CPV 模型时, 宏观经济因素个数必须达到 3 个以上时该模型才具有一定的有效性 ( 估计有效性及预测有效性) 。因此, 本文分别从国家宏观经济、房地产行业状况、房地产企业状况三个方面选择出三个宏观经济因素指标, 运用 CPV 模型评估房地产信贷的信用风险。综合领先指标(Composite Leading Indicator) 。经济合作与发展组织 (OECD) 的综合领先指标(CompositeLeading Indicator, CLI) 被认为是预测全球经济变动趋势的良好指标, 它是指一系列引导经济由增长至衰退的循环的相关经济指标和经济变量的加权平均数, 主要用来预测整体经济的转变情况, 预测未来数月的经济发展趋势:
###违约率再0到1之间 ,因此对其进行标准化
cr=(fbzdata$NA.-min(fbzdata$NA.))/(max(fbzdata$NA.)-min(fbzdata$NA.))
##绘制时间序列图
plot(diff(cr),type="l")
从上图可以看到数据呈现出稳定的波动趋势,再均值周围回摆,因此差分后数列稳定。
CPV模型
#逻辑回归结果
##滞后期的选择
#MA(1)
ma1=arma(x=cr,order=c(0,1))
summary(ma4)#查看相关系数,Std. Error t value,AIC值
滞后期的选择根据Akaike Information Criterion(AIC)准则确定。
根据回归结果显示CLI、CRECI和ECI的P值显示的数值表明该估计的有效性。从估计出的敏感系数可以看出,CLI、和ECI的系数(Coefficient)为正, CRECI的系数(Coefficient)为负,并且ECI的系数值是CLI系数值的2倍左右所以, 当CRECI的值上升的时候,Y值也上升 (违约率下降), 它们之间是反向变化。并且, 综合领先指标ECI相对于其他宏观经济指标来说, 影响力度最大。
残差值分析
plot(CPVmod$residuals,type="l")#残差值
lines(CPVmod$fitted.values,type="l")#拟合值
lines(cr,type="l")#实际值
abline(h=0)#添加0基准线
根据上面的模型估计结果, 可以得出Y的残差值、实际值和拟合值的趋势图。如图1所示。
根据图1的趋势图, 可以清楚地看出, Y的拟合值和实际值的曲线几乎完全重合, 这也说明该模型很好地拟合了样本数据, 也跟上述结果表明的事实相符合。
另外, 残差的相关系数和偏相关系数如图2所表示。从图2可以看出, 模型的残差不存在序列自相关。
点击标题查阅往期内容
PYTHON链家租房数据分析:岭回归、LASSO、随机森林、XGBOOST、KERAS神经网络、KMEANS聚类、地理可视化
左右滑动查看更多
01
02
03
04
残差自相关和偏相关分析
acf(CPVmod$residuals)#自相关系数
pacf(CPVmod$residuals)#偏相关系数
BG高阶自相关系数检验
进一步用布—戈弗雷检验(Breusch-Godfrey, BG检验)来检验残差的序列自相关性的情况, 从上面的检验结果,可以看出, P值较大, 根据BG高阶自相关系数检验原理, 该检验结果接受原假设, 即上述模型的残差不存在自相关性, 也进一步证实了前面的自相关系数和偏自相关系数的检验结果。
综上所述, 此模型检验达到预期要求, 较好地反映了宏观经济实际状况和各宏观经济变量之间的对应关系。
宏观经济变量的趋势
lines(fbzdata$CLI,col="red",type="l")
lines(fbzdata$CERCI,col="green",type="l")
违约率拟合值和实际值的对比
plot(CPVmod$fitted.values,type="l")#拟合值
lines(cr,type="l")#实际值
预测信贷违约率
pre=predict(ma7, 50)#预测值
plot(unlist(pre),type="l")
仍选择综合领先指标(CLI), 国房景气指数(CRECI)以及企业景气指数(ECI)三个宏观经济变量, 运用CPV模型的估计结果对未来2年的每个月的房地产信贷违约率进行预测,
为了直观地表示出违约率的变化趋势及其与CLI、CREIC、ECI三个变量之间的关系, 分别做出趋势图。从中可以看出:在11月份, 虽然ECI上升, 但是由于CRECI和CLI下降的共同作用, 对于房地产信贷来说经济状况趋势还是下降, 因此违约率略有上升。但是从3月份开始, 由于宏观经济、房地产行业和企业三个层面的景气好转, 房地产信贷违约率逐渐下降。这个预测趋势结果仅作为参考, 这里主要是为了说明模型的预测功能对于商业银行抵抗信贷风险的重要意义。
点击文末 “阅读原文”
获取全文完整代码数据资料。
本文选自《R语言用CPV模型的房地产信贷信用风险的度量和预测》。
点击标题查阅往期内容
R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响
R语言Lasso回归模型变量选择和糖尿病发展预测模型
数据分享|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况R语言是否对二分连续变量执行逻辑回归
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值R语言Bootstrap的岭回归和自适应LASSO回归可视化
R语言中回归和分类模型选择的性能指标
R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用
R语言 线性混合效应模型实战案例
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言建立和可视化混合效应模型mixed effect model
R语言LME4混合效应模型研究教师的受欢迎程度
R语言 线性混合效应模型实战案例
R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题
基于R语言的lmer混合线性回归模型
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
R语言分层线性模型案例
R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据
用SPSS估计HLM多层(层次)线性模型模型
以上是关于R语言用CPV模型的房地产信贷信用风险的度量和预测|附代码数据的主要内容,如果未能解决你的问题,请参考以下文章
R语言逻辑回归(Logistic Regression)回归决策树随机森林信用卡违约分析信贷数据集|附代码数据