《最新四章节风险估测精品课件.ppt》由会员分享,可在线阅读,更多相关《最新四章节风险估测精品课件.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节第一节 风险统计分析风险统计分析v收集数据收集数据v数据的表示数据的表示v数据的计量数据的计量二、数据的表示二、数据的表示图和表图和表v频数分布表频数分布表确定组数:组数的确定应以能够显示数据的分布特确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数提出的经验公式来确定组数K:ln( )1ln(2)nK 确定各组的组距:组距是一个组的上限与下限之差,确定各组的组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来可根据全部数据的最大值和最小值及所分的组数来确定
2、,即组距确定,即组距( ( 最大值最大值 - - 最小值)最小值) 组数组数 二、数据的表示二、数据的表示图和表图和表v直方图直方图用矩形的宽度和高度来表示频数分布的图形,用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布。实际上是用矩形的面积来表示各组的频数分布。在直角坐标中,用横轴表示数据的组别,纵轴在直角坐标中,用横轴表示数据的组别,纵轴表示频数或频率,各组与相应的频数就形成了表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。一个矩形,即直方图。(频率)直方图下的总面积等于(频率)直方图下的总面积等于1 1。二、数据的表示二、数据的表示图和表图和表
3、二、数据的表示二、数据的表示图和表图和表v饼图饼图也称圆形图,也称圆形图,是用圆形及圆内扇形的面积来表是用圆形及圆内扇形的面积来表示数值大小的图形。示数值大小的图形。主要用于表示总体中各组成部分所占的比例,对主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。于研究结构性问题十分有用。在绘制饼图时,总体中各部分所占的百分比用园在绘制饼图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占是按各部分百分比占3603600 0的相应比例确定的。的相应比例确定的。二、数据的表示二、数据的表示图和表图和表
4、v条形图条形图条形图是用宽度相同的条形的高度或长短来表示条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。数据变动的图形。条形图有单式、复式等形式。条形图有单式、复式等形式。绘制时,各类别可以放在纵轴,称为条形图,也绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。可以放在横轴,称为柱形图。二、数据的表示二、数据的表示图和表图和表v条形图条形图频数频数36916109004080120 食品损坏食品损坏 失窃失窃 责任诉讼责任诉讼 故障故障 火灾火灾 风风险险类类型型 二、数据的表示二、数据的表示图和表图和表v条形图与直方图的区别条形图与直方图的区别条形图是用条形的长
5、度(横置时)表示各类别频条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度是固定的,没有实际意义。数的多少,其宽度是固定的,没有实际意义。直方图是用面积表示各组频数(率)的多少,矩直方图是用面积表示各组频数(率)的多少,矩形的高度表示每一组的频数或频率,宽度表示各形的高度表示每一组的频数或频率,宽度表示各组的组距,均有意义。组的组距,均有意义。直方图的各矩形通常是连续排列的,条形图则是直方图的各矩形通常是连续排列的,条形图则是分开排列的。分开排列的。二、数据的表示二、数据的表示图和表图和表v曲线图曲线图只有时间序列数据才能用曲线连接起来,反映只有时间序列数据才能用曲线连接起来,反映了变
6、量随时间变化的趋势。了变量随时间变化的趋势。坐标轴的比例不同,直观上所表现出来的曲线的坐标轴的比例不同,直观上所表现出来的曲线的升降幅度也不同。升降幅度也不同。二、数据的表示二、数据的表示图和表图和表v曲线图曲线图二、数据的表示二、数据的表示图和表图和表v曲线图曲线图三、数据的计量三、数据的计量分布特征的测度分布特征的测度分布形状分布形状集中趋势集中趋势离散程度离散程度三、数据的计量三、数据的计量三、数据的计量三、数据的计量v位置的计量位置的计量“当代美国的当代美国的平均人平均人是女人,是女人,平均平均每个女人每个女人有有2.12.1个孩子,且这些女人住在个孩子,且这些女人住在平均价值平均价值
7、为为8000080000美元的住房中。美元的住房中。”这句话中分别用了三种平均值,你能分辨出这句话中分别用了三种平均值,你能分辨出它们有何不同吗?它们有何不同吗?三、数据的计量三、数据的计量v位置的计量位置的计量均值:均值:数据的算术平均数。数据的算术平均数。最常用的统计量,一最常用的统计量,一组数据的均衡点所在,易受极端值的影响。组数据的均衡点所在,易受极端值的影响。中位数:中位数:数据排序后处于中间位置的数值。数据排序后处于中间位置的数值。只代只代表一个位置,不受极端值的影响。表一个位置,不受极端值的影响。众数:众数:出现次数最多的值(即频数或频率最高)。出现次数最多的值(即频数或频率最高
8、)。不受极端值的影响,可能没有也可能不唯一。不受极端值的影响,可能没有也可能不唯一。三、数据的计量三、数据的计量v位置的计量位置的计量几何平均数几何平均数p主要用于计算平均发展速度主要用于计算平均发展速度p计算公式为:计算公式为:121NNNMNiiGXXXX平均发展速度平均发展速度= =GM-1-1三、数据的计量三、数据的计量 例例 某超市近四年来因失窃而支出的费用增长率分别为某超市近四年来因失窃而支出的费用增长率分别为4.5%4.5%、2.0%2.0%、3.5%3.5%、5.4%5.4%。试计算该超市在这四年内因失。试计算该超市在这四年内因失窃支出的平均费用增长率。窃支出的平均费用增长率。
9、%84.103%4 .105%5 .103%0 .102%5 .104421NNMXXXG平均费用增长率平均费用增长率103.84%-1=3.84%三、数据的计量三、数据的计量v离散程度的计量离散程度的计量221()niixxSn全距:全距:一组数据中最大值与最小值的差值。一组数据中最大值与最小值的差值。方差:方差:反映了各变量值与均值的平均差异,是数反映了各变量值与均值的平均差异,是数据离散程度最重要的测度。据离散程度最重要的测度。标准差:标准差:方差的正的平方根。方差的正的平方根。21()niixxSn三、数据的计量三、数据的计量v离散程度的计量离散程度的计量变差系数变差系数p消除了数据量
10、级和计量单位的影响。消除了数据量级和计量单位的影响。p可以用于对不同数据离散程度的比较。可以用于对不同数据离散程度的比较。p一组数据的标准差与均值之比。一组数据的标准差与均值之比。sSVx三、数据的计量三、数据的计量v偏态偏态3(均值 中位数)偏态标准差分布对称性的衡量。分布对称性的衡量。偏态的计算公式:偏态的计算公式:右偏与左偏的含义右偏与左偏的含义三、数据的计量三、数据的计量第二节第二节 概率的计算概率的计算v概率的计算方法概率的计算方法v损失概率的估计损失概率的估计v概率分布概率分布一、概率的计算方法一、概率的计算方法v概率是描述一个随机事件发生可能性大小的数值。概率是描述一个随机事件发
11、生可能性大小的数值。确定风险事故的观察期。考察期限越长,越能说明确定风险事故的观察期。考察期限越长,越能说明风险事故发生的大致情况。风险事故发生的大致情况。运用概率衡量风险是在假设发生风险事故的条件不运用概率衡量风险是在假设发生风险事故的条件不变的情况下估算的。如果发生风险事故的条件发生变的情况下估算的。如果发生风险事故的条件发生了变化,则根据以往的统计资料来预测风险事故的了变化,则根据以往的统计资料来预测风险事故的发生,就不一定代表未来风险事故发生的情况。发生,就不一定代表未来风险事故发生的情况。v在运用概率衡量风险发生的可能性时,应该考虑以下在运用概率衡量风险发生的可能性时,应该考虑以下几
12、个方面的因素:几个方面的因素:确定风险事故发生的大致范围。确定风险事故发生确定风险事故发生的大致范围。确定风险事故发生的最高频率和最低频率。的最高频率和最低频率。一、概率的计算方法一、概率的计算方法v先验概率法先验概率法条件:条件:AP A 有利于事件 发生的结果个数( )所以可能的结果个数计算公式:计算公式:1)所有结果发生的可能性相同;)所有结果发生的可能性相同;2)所有可能的结果是已知的。)所有可能的结果是已知的。根据古典概型的定义用数学的分析方法进行计算根据古典概型的定义用数学的分析方法进行计算得到的概率称为先验概率。得到的概率称为先验概率。一、概率的计算方法一、概率的计算方法v经验概
13、率法经验概率法当历史数据不精确或不存在时,对事件发生的可当历史数据不精确或不存在时,对事件发生的可能性做出主观判断。能性做出主观判断。依据大量的经验数据进行计算得出的概率称为经依据大量的经验数据进行计算得出的概率称为经验概率。验概率。v主观概率法主观概率法当样本量足够大时,用频率估计概率。当样本量足够大时,用频率估计概率。风险管理者对风险认识的态度及搜集的信息决定风险管理者对风险认识的态度及搜集的信息决定主观概率。主观概率。二、损失概率的估计二、损失概率的估计v在衡量损失概率时,需要考虑三项因素:一是风险单在衡量损失概率时,需要考虑三项因素:一是风险单位数;二是损失形态;三是损失事件(或原因)
14、。这位数;二是损失形态;三是损失事件(或原因)。这三项因素在不同组合情况下应分别估计损失概率。三项因素在不同组合情况下应分别估计损失概率。v一个风险单位遭受单一事件所致单一损失形态的损失一个风险单位遭受单一事件所致单一损失形态的损失概率。这一单一事件的发生概率即为该损失形态的损概率。这一单一事件的发生概率即为该损失形态的损失概率。失概率。v一个风险单位遭受多种事件所致单一损失形态的损失一个风险单位遭受多种事件所致单一损失形态的损失概率。那么除了考虑各个事件单独发生的损失概率之概率。那么除了考虑各个事件单独发生的损失概率之外,还应考虑这些事件同时发生的概率,这一概率适外,还应考虑这些事件同时发生
15、的概率,这一概率适用于联合事件概率计算公式。而该风险单位遭受损失用于联合事件概率计算公式。而该风险单位遭受损失的概率则适用于择一事件的概率计算公式。的概率则适用于择一事件的概率计算公式。二、损失概率的估计二、损失概率的估计v择一事件的概率择一事件的概率P ABP(A)P(B)P(AB)()一般公式:一般公式:当两个事件是互斥事件时,遵循加法法则:当两个事件是互斥事件时,遵循加法法则:P ABP(A)P(B)()二、损失概率的估计二、损失概率的估计v联合事件的概率联合事件的概率P ABP(A) P(B A)()一般公式:一般公式:当两个事件相互独立时,遵循乘法法则:当两个事件相互独立时,遵循乘法
16、法则:P ABP(A) P(B)()v概率树概率树第三节第三节 概率分布概率分布v概率分布概率分布v正态分布正态分布v对数正态分布对数正态分布v泊松分布泊松分布v二项分布二项分布v大数法则大数法则一、概率分布一、概率分布v代表随机现象各种结果的变量称为随机变量。常用代表随机现象各种结果的变量称为随机变量。常用大写字母大写字母X、Y、Z表示,而它们的取值则分别用表示,而它们的取值则分别用x、y、z表示。表示。v随机变量根据其取值的形式和特征可分为离散型随随机变量根据其取值的形式和特征可分为离散型随机型随机变量和连续型随机变量。机型随机变量和连续型随机变量。v随机变量的分布是用函数的形式描述以下两
17、方面的随机变量的分布是用函数的形式描述以下两方面的内容:内容:1.随机变量随机变量X可能取哪些值,或在哪个区间上可能取哪些值,或在哪个区间上取值;取值; 2.X取这些值的概率分别是多少,或在某一取这些值的概率分别是多少,或在某一区间上取值的概率是多少。区间上取值的概率是多少。一、概率分布一、概率分布v根据取得的实际数据绘制的分布图即为该数据所属总体的实际分布。根据取得的实际数据绘制的分布图即为该数据所属总体的实际分布。v假定一个接一个地测量某单位的风险特征变量假定一个接一个地测量某单位的风险特征变量X X,把测量得到的,把测量得到的x x值一个接一值一个接一个地放在数轴上。当累积到很多个地放在
18、数轴上。当累积到很多x x值时,就形成一定的图形,为了使这个图形值时,就形成一定的图形,为了使这个图形得以稳定,需把纵轴改为单位长度上的频率。由于频率的稳定性,随着被测得以稳定,需把纵轴改为单位长度上的频率。由于频率的稳定性,随着被测风险特征值风险特征值x x的数量愈多,这个图形就愈稳定,其外形显现出一条光滑曲线这的数量愈多,这个图形就愈稳定,其外形显现出一条光滑曲线这条曲线就是概率密度曲线,相应的函数表达式条曲线就是概率密度曲线,相应的函数表达式p p(x x)称为概率密度函数,它)称为概率密度函数,它就是一种表示风险特征变量就是一种表示风险特征变量X X 随机取值内在统计规律性的函数。随机
19、取值内在统计规律性的函数。一、概率分布一、概率分布v显然,绘制实际分布费时费力,且很多分布整体上显然,绘制实际分布费时费力,且很多分布整体上而言可能是相似的。此时,我们可以利用一些与实而言可能是相似的。此时,我们可以利用一些与实际分布情况接近的理论分布来衡量风险,简化分析际分布情况接近的理论分布来衡量风险,简化分析过程。过程。v使用理论分布来描述风险分布特征的前提是存在一使用理论分布来描述风险分布特征的前提是存在一些和实际情况相匹配的理论分布,从而可以根据实些和实际情况相匹配的理论分布,从而可以根据实际情况进行选择。际情况进行选择。v相应于随机变量的类型,从广义上而言,理论分布相应于随机变量的
20、类型,从广义上而言,理论分布也分为两类:离散型概率分布和连续型概率分布。也分为两类:离散型概率分布和连续型概率分布。一、概率分布一、概率分布v对于随机变量的概率分布,可以计算几个重要的特对于随机变量的概率分布,可以计算几个重要的特征数,即分别用于度量其分布的中心趋势和分散程征数,即分别用于度量其分布的中心趋势和分散程度的均值、方差、标准差。度的均值、方差、标准差。 iiibax pXE Xxp x dxX,若 是离散分布=, 若 是连续分布 22iiibaxE XpXVar XxE Xp x dxX,若 是离散分布=, 若 是连续分布二、正态分布二、正态分布v正态分布描述了受许多微小的、相互独
21、立的随机因正态分布描述了受许多微小的、相互独立的随机因素综合影响的变量的分布形态。数学家高斯素综合影响的变量的分布形态。数学家高斯(Gauss)(Gauss)在研究误差理论时提出用它来描述误差的分布,因在研究误差理论时提出用它来描述误差的分布,因此,人们也常把正态分布称为此,人们也常把正态分布称为Gauss分布。分布。 v正态分布的密度函数为:正态分布的密度函数为: 22()21( ),2xf xexR 式中,式中, 为正态分布的两个参数。不难计算,正为正态分布的两个参数。不难计算,正态分布的数学期望态分布的数学期望 ,方差,方差 。随机变量。随机变量X服服从以从以 为参数的正态分布,一般简记
22、为为参数的正态分布,一般简记为 。 ,(0,)R()E X2()Var X2, 2( ,)XN 三、对数正态分布三、对数正态分布v由于对数正态分布是呈正偏斜的,因此,保险经营及由于对数正态分布是呈正偏斜的,因此,保险经营及风险管理中,这一分布常常被人们用来描述个别受损风险管理中,这一分布常常被人们用来描述个别受损单位的损失状况。单位的损失状况。 v如果随机变量如果随机变量X X的对数函数的对数函数 ,则称随,则称随机变量机变量X X服从以服从以 为参数的对数正态分布,记作为参数的对数正态分布,记作 。通过计算可以得到对数正态分布的密度函数为:通过计算可以得到对数正态分布的密度函数为: 2ln(
23、 ,)YXN 2, 2( ,)XLN 22(ln)21( ),02xf xexxv从直观上讲,个体风险的损失额从直观上讲,个体风险的损失额的分布应该有明显的的分布应该有明显的正偏斜,也就是其密度函数在右边有一个长正偏斜,也就是其密度函数在右边有一个长“尾巴尾巴”。 三、对数正态分布三、对数正态分布 例例 已知某特定风险的损失额服从参数为已知某特定风险的损失额服从参数为 的对的对数正态分布,那么从数正态分布,那么从400400元到元到4000040000元的损失额在全部损元的损失额在全部损失记录中占多大的比例?失记录中占多大的比例? 7,1.7v解:用解:用X X表示该特定风险的赔款额,根据题意
24、表示该特定风险的赔款额,根据题意 ,也就是说也就是说 。题中实际是要计算该特定风。题中实际是要计算该特定风险的赔款额落在险的赔款额落在400400元到元到4000040000元的概率,即元的概率,即 2(7,1.7 )XLN2ln(7,1.7 )XNln4007ln7ln400007(40040000)()1.71.71.7XPXP(2.12)( 0.59) (2.12)(0.59) 1 0.7054四、泊松分布四、泊松分布v当随机变量当随机变量X X的分布列为:的分布列为: (),0,1,2,!xP Xxexx 称随机变量称随机变量X X服从参数为服从参数为 的泊松分布,记作的泊松分布,记作
25、 ,其,其中中 。 ( )XP0v泊松分布的均值和方差都是泊松分布的均值和方差都是 。泊松分布的一个重要性质。泊松分布的一个重要性质是:是:n个相互独立的参数为个相互独立的参数为 的泊松分布随机变量的和服的泊松分布随机变量的和服从参数为从参数为 的泊松分布。这种性质我们称之为可加性。的泊松分布。这种性质我们称之为可加性。 nv显然,损失次数是一个取值为非负整数的离散型随显然,损失次数是一个取值为非负整数的离散型随机变量。而常用来描述损失次数的离散型分布主要机变量。而常用来描述损失次数的离散型分布主要有泊松分布、二项分布等。有泊松分布、二项分布等。 四、泊松分布四、泊松分布v在保险中,常用来计算
26、在某一特定周期内发生损失若干在保险中,常用来计算在某一特定周期内发生损失若干次的概率,其方法是:如果次的概率,其方法是:如果 为长期中每一个周期(周为长期中每一个周期(周期一般是一年,但也可以是其它预算周期,如半年、季期一般是一年,但也可以是其它预算周期,如半年、季度、月等)损失的平均数,则某一特定周期发生损失次度、月等)损失的平均数,则某一特定周期发生损失次的概率就可以利用泊松分布的分布列公式计算出来。的概率就可以利用泊松分布的分布列公式计算出来。 v当条件满足下面两个要求时,泊松分布就可以为我们当条件满足下面两个要求时,泊松分布就可以为我们提供相当精确的近似值:(提供相当精确的近似值:(1
27、 1)至少有)至少有5050个相互独立的个相互独立的风险单位;(风险单位;(2 2)每次损失发生的概率相同,且概率很)每次损失发生的概率相同,且概率很小(一般要小于小(一般要小于0.10.1)。)。 五、二项分布五、二项分布v二项分布描述的是二项分布描述的是n重贝努利试验中事件重贝努利试验中事件A(成功)(成功)发生发生x次的概率,因而可以用来作为同质风险等额保次的概率,因而可以用来作为同质风险等额保单赔款次数的概率分布模型。二项分布随机变量单赔款次数的概率分布模型。二项分布随机变量X X的的分布列为:分布列为: v二项分布的均值和方差分别是:二项分布的均值和方差分别是:E(X)=np,Var(X)=np(1-p) ()(1),0,1,2,xxn xnP XxC ppx参数为参数为n和和p,n为非负整数,为非负整数,0pLPX来计算。(其中PX是选择的概率水平,L就是在概率水平PX下,满足这个不等式的最小值)。(四)年度预期最大损失v单个或多个风险单位在一年内可能遭受一种或多种风险事故所可能遭受的最大总损失额本章学习重点v风险估测在风险管理中的作用v风险估测定性和定量的方法v最大可能损失、年度最大可能损失与最大预期损失的计算
限制150内