-
1 教案
-
2 实验课件
损失额的基本特征分析实验
1. 损失分布的估计
(1)整理数据,计算其标志值;
>spe=xlsread('C:\Users\Administrator\Desktop\作业\风险管理\spe.xls');
>spe_mean=mean(spe);
>S1=std(spe)
>spe_max=max(spe)
>spe_min=min(spe)
>spe_range=range(spe)
>spe_median=median(spe)
>spe_mode=mode(spe)
>spe_cvar=std(spe)/mean(spe)
>spe_skewness=skewness(spe)
>spe_kurtosis=kurtosis(spe)
计算结果其标志值为:
均值spe_mean=96.3353, 标准差S1 = 129.6162,
最大值spe_max = 781, 最小值spe_min= 0.0012,
极差spe_range = 780.9988,中位数spe_median= 36.0628,
众数spe_mode = 0.0012, 变异系数spe_cvar= 1.3455,
偏度spe_skewness = 2.347,峰度spe_kurtosis= 8.9615.
(2)风险损失赔付额画直方图和折线图
> [f,xc]=ecdf(spe);
>figure;
>ecdfhist(f,xc,16);
>xlabel('索赔额');
>ylabel('频率');
>title('损失频率直方图');
>figure;
> [h,stats]=cdfplot(spe)
>set(h,'color','k','LineWidth',2);
(3)观察其分布特征,选择适合的分布进行拟合,估计其拟合分布的参数(dfittool 调用函数)
2. 损失分布的近似
(1)如果,求分别用中心极限定理、平移伽玛、NP近似.
>x <- 3.5
>mu <- 1
>sig <- 1
>gam <- 1
>z <- (x-mu)/sig
>1-pbinom(x,1000,0.001)
>1-ppois(x,1)
>1-pnorm(z)
>1-pnorm(sqrt(9/gam^2+6*z/gam+1)-3/gam)
>1-pgamma(x-(mu-2*sig/gam),4/gam^2,2/gam/sig)
结果:
0.01892683
0.01898816
0.006209665
0.02275013
0.02122649
2 索赔频率的分析实验
R中有丰富的数据库资源。第一个数据库,“freMTPLfreq”,包含来自一家法国保险公司的合同与客户信息,与一些汽车保险组合相关.
(1)(数字)PolicyID,,合同编号(用于与索赔数据集链接)
(2)(数字)ClaimNb,暴露期间的索赔次数
(3)(数字)Exposure,披露,年
(4)(因子)Power,汽车功率(有序分类)
(5)(数字)CarAge,汽车的年龄
(6)(数字)DriverAge,驾驶员的年龄(在法国,人们在18岁的时候可以开车)
(7)(因子)Briand,汽车品牌,A:雪诺日产,和雪铁龙;B:大众,奥迪,斯柯达和西亚特;C:欧宝,通用汽车,和福特;D:菲亚特;E:梅赛德斯克莱斯勒和宝马;F:日本(除尼桑)和韩国;G:其他.
(8)(因子)Gas,含柴油或常规
(9)(因子)Region,法国的不同区域(基于标准的法语分类)
(10) (数字)Density,汽车司机居住在城市的居民密度(每平方千米的居民数量)
注意:在法国的保险市场,有一个强制性的无索赔奖金制度(见Lemaire(1984年)对该系统的描述). 在法国,保险价格是本章中讨论的先验费率和下一章将要讨论的后验费率的混合. 但是人们应该记住,由于这种无索赔制度或者退回红利在被保险人索赔损失的情况下,如果相关损失比未来的保险退回红利更小,可能会有(财务)奖励而不申报一些索赔.
为了使用分类变量更加方便的,定义
(5)中(因子)CarAge,[0,1),[1,4),[4,15),以及[15,)
(6)中(因子)DriverAge,(17,22],(22,26],(26,42],(42,74],以及(74,)
(10) 中(因子)Density,[0,40),[40,200),[200,500),[500,4500),以及[4500,)
>library(CASdatasets)
>data(freMTPLfreq)
>data(freMTPLsev)
>CONTRACTS.f<-freMTPLfreq
>CONTRACTS.f$DriverAge<-cut(freMTPLfreq$DriverAge,c(17,22,26,42,74,Inf))
>CONTRACTS.f$CarAge<- cut(freMTPLfreq$CarAge,c(0,1,4,15,Inf),
+ include.lowest = TRUE)
>CONTRACTS.f$Density<- cut(freMTPLfreq$Density,c(0,40,200,500,4500,Inf),
+ include.lowest = TRUE)
第二个数据集,“freMTPLsev”,包含来自同一家公司的索赔信息.
(1)(数字)PolicyID,合同编号(用于连接协定数据集);
(2)(数字)ClaimAmount,索赔费用,见于最近日期.
假设索赔发生,对于被保险人来说,索赔发生服从于同质泊松过程,强度都为,因此发生的索赔过程具有独立的增量,在时间间隔为期间观察到的索赔数量服从泊松分布. 该模型允许我们将给定暴露期间的年度频率和观测频率联系起来,对于保单持有者:
(1)[0,1]期间的年度索赔次数(通常)是一个不可观测的变量;
(2)数据库中的实际索赔次数发生在[0,]期间,其中是暴露的.
从某种意义上说,我们在这里处理的是审查的数据,因为我们无法在观察一整年内的合同.在没有任何解释变量的情况下,平均年度频率及其经验方差分别为:
, 以及
>vY<-CONTRACTS.f$ClaimNb
>vE<-CONTRACTS.f$Exposure
> m <-sum(vY)/sum(vE)
> v <-sum((vY-m*vE)^2)/sum(vE)
>cat("average=",m," variance =",v,"phi =",v/m,"\n")

