河海大学数学建模基于历史数据分析的金融投资风险问题.doc
-
资源ID:17647878
资源大小:370KB
全文页数:8页
- 资源格式: DOC
下载积分:15金币
快捷下载

会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
河海大学数学建模基于历史数据分析的金融投资风险问题.doc
【精品文档】如有侵权,请联系网站删除,仅供学习与交流河海大学数学建模基于历史数据分析的金融投资风险问题.精品文档.基于历史数据分析的金融投资风险问题摘要本文针对金融投资的问题建立了两种模型。首先,通过对历史数据的分析 ,发现日收益额的样本大体呈正态分布,据此提出假设并建立了正态分布通用模型,并采用概率纸检验法对分布的正态性进行检验,得出交易日的日投资效益分布近似服从正态分布,并利用其正态分布的性质进行求解,得出:一个周期内损失数额超过10 万元的概率为3.80%,以 95%的置信度保证损失的数额不会超8.72 万元,一个周期内损失超过是10万元的可能性不大于5%的初始投资额最多为1147 万元;两个周期内损失数额超过10 万元的概率为3.65%,以 95%的置信度保证损失的数额不会超7.94 万元,两个周期内损失超过是10万元的可能性不大于5%的初始投资额最多为1259 万元。模型结论可推广到T个周期的情况。其次,针对解决预测收益的数值及以一定置信度为基础的损失分析的问题,建立一个VaR (Value at Risk)风险分析模型,得出关于初始投资额M、 限定损失额L、 置信度(1-)和周期个数T的一般数学表达式,采用方差协方差法对VaR模型进行求解。利用已建立的VaR模型估计在下一个周期内的损失的数额超过10万元的可能性,以及能以95%的置信度保证损失的数额的上限值,并利用相同的方法估计下两个周期的情况。通过比较正态分布模型与VaR风险分析模型,发现两者对下一周及下两周的估计情况相近,故估计的结果具有可靠性,模型具有稳定性。关键词:正态分布;VaR模型;置信度;收益额;金融投资一、问题重述某公司在金融投资中,需要考虑如下两个问题:1)准备用数额为1000万元的资金投资某种金融资产(如股票,外汇等)。它必须根据历史数据估计在下一个周期(如1天)内的损失的数额超过10万元的可能性有多大,以及能以95%的置信度保证损失的数额不会超过多少。2)如果要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为多少。下面是该公司在过去一年255个交易日的日收益额(单位为万元)的统计数据, 假定每天结算一次,保持每天在市场上的投资额为1000万元:收益额33323130292827262524232221201918天数1111121214026347收益额171615141312111098765432天数58571014819911111410668收益额10-1-2-3-4-5-6-7-8-9-10-11-12-13-14天数9593741625532210收益额-15-16-17-18-19-20-21-22-23-24-25-26-27-28-29-30天数1000000100100000要求:1) 参考以上数据,建立两种模型来解决前述的两个问题,并对这两个模型加以比较;2) 讨论二周期情形(如今后两天内)上述两个问题的答案。3) 陈述上述两个问题的一般形式(即初始投资额为M, 限定损失额为L, 置信度为 1-, T 个周期)及其解决方案。二、问题分析这是一个根据已知历史收益额情况下,为将来获得较丰厚的收益而制定投资计划的问题。255个交易日的日收益额,可以看作数理统计中的样本观测值。首先,可以采用绘制样本散点图的方法,探究样本观测值的分布规律,据此选择并建立两个代表模型,确定抽样分布的概率密度函数和分布函数的通用表达式及各个参数。其次,由建好的模型预测一个周期内及两个周期内的损失的数额超过10万元的可能性,以及得出能以95%的置信度保证损失的数额不会超过多少。最后对建立的两个模型的可靠度及稳定性进行分析比较,具体情况具体分析,扬长避短,选择适宜的求解模型。图一:问题分析流程图三、模型假设(1)各个周期的收益额相互独立,不存在相关性;(2)各个周期服从的概率分布均相等,不存在差异性;(3)金融投资市场基本稳定,公司收益额的总体概率走势不会因投资额的改变而发生剧烈变化,并且影响收益额的其他因素在本文研究的较长时期内不发生变化;(4)题中给出的255个交易日的收益额为随即抽样样本,基本上可以认为能够充分反映该公司一年的整体收益情况;(5)各种风险资产之间没有一定的关联性。四、符号系统:投资中的初始投资额; :第i 种收益在样本中的天数;:在样本中第i 种收益的值,分别取-30,-29,32,33;:概率密度函数;:给定置信区间内的一个特定持有期内的最大可能损失。注:其它符号文章中给予说明。五、模型建立5.1模型一的分析与建立采用绘制样本散点图的方法,观察点据分布情况,初步估计样本大体符合正态分布规律,如图二所示。下面采用数值正态分析的频率纸检验法进行证明。图二:样本散点图5.1.1对取样进行数值正态分析概率纸检验法5.1.1.1 数据输入x = 33 32 31 30 29 28 28 27 26 26 25 24 24 24 24 22 22 21 21 21 21 21 21 20 20 20 19 19 19 19 18 18 18 18 18 18 18 17 17 17 17 17 16 16 16 16 16 16 16 16 15 15 15 15 15 14 14 14 14 14 14 14 13 13 13 13 13 13 13 13 13 13 12 12 12 12 12 12 12 12 12 12 12 12 12 12 11 11 11 11 11 11 11 11 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 3 3 3 3 3 3 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 0 0 0 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -2 -2 -2 -3 -3 -3 -3 -3 -3 -3 -4 -4 -4 -4 -5 -6 -6 -6 -6 -6 -6 -7 -7 -8 -8 -8 -8 -8 -9 -9 -9 -9 -9 -10 -10 -10 -11 -11 -12 -12 -13 -15 -22 -25 ; 5.1.1.2 作频数直方图 利用 matlab 中的直方图命令hist(x),作出255 个交易日的日投资效益频率分布直方图三。从图可知,该投资效益出现的可能性近似服从正态分布。图三:255个交易日的日投资效益频率分布直方图5.1.1.3分布的正态性检验 在matlab中分别输入以下命令:normplot(x) 和weibplot(x),分别得到图四和图五。 从图四 可知,数据基本上分布在一条直线上,初步可以断定该投资效益出现的概率服从正态分布。而图五显示的是数据矩阵x的weibull概率图,如果数据来自于weibull分布,则图形将显示出直线性形态,否则显示出曲线形态。比较图四和图五可以确定,255个交易日的日投资效益分布近似服从正态分布。图四:255个交易日的日投资效益正态分布检验图 图五:255 个交易日的日投资效益威尔逊分布检验图5.1.1.4参数估计在基本确定所给数据x 的分布后,就可以估计该数据的参数。输入以下命令:muhat,sigmahat,muci,sigmaci=normfit(x);结果:muhat = 7.4863; sigmahat = 9.8520muci =6.2713,8.7013; sigmaci =9.0647,10.7902估计出该分布的均值为7.4863,标准差为9.8520,均值的0.95 置信区间为6.2713,8.7013,标准差的0.95 置信区间为9.0647,10.7902。5.1.1.5小结通过 matlab 的正态拟合与参数的估计可知该收益的分布近似服从正态分布,其中正态分布的参数分别用样本的均值与标准方差来进行估计,因此该分布的密度函数为:其中: 。5.1.2利用模型一求解在5.1中已分析并建立了模型一(近似的正态分布模型),得出了收益额服从的正态分布的密度函数,下面针对题中所给出的关于预测收益的可能性及以一定置信度为基础进行损失分析的问题,采用对该分布进行分析求解概率的方法解答。首先,分析一个周期和两个周期内损失的数额超过10万元的可能性有多大问题,题中条件对于已建立的正态分布模型一相当于提供了分布自变量的区间,可以直接利用分布函数求得。其次,关于能以95%的置信度保证损失的数额不会超过多少的问题,可采用将分布函数化为标准正态分布进行计算,也可查表得到相应的损失值。5.1.2.1一个周期的情况利用上面得到的样本数据的均值与标准差,可以写出该近似正态分布的密度函数,表达式为: 其中: 。第一小问中估计在下一个周期(如1 天)内损失的数额超过10 万元的可能性有多大,可由概率表达式来表示:经查正态分布表及用matlab 计算可知;故下一个周期内损失数额超过10 万元的概率为3.80%。第二小问中假设以 95%的置信度保证损失的数额不会超X 万元,则有该分布服从正态分布可知:,由概率知识可知该等式可以化为:所以;将各个数据带入得 X=8.72(万元)。第三小问中求为使损失额不大于10 万元的投资额:在第二问中已算出损失值达到95% 的置信区间时的最大损失额为8.72 万元,按同样的比例求得当最多损失为10 万元的投资额应为1147 万元。5.1.2.2 两个周期的情况当为两周期情形(如今后两天内)时,对于上述两个问题而言,设第一天的收益额是,第二天的收益为,根据上述模型假设(3),均服从模型一的正态分布,其中, 。同理得出两个周期的情形,关系式为:由于关系式中X,未知,需求出X,的值。引理:若X,Y相互独立且X,Y,则的正态分布。 2故的正态分布,计算方法同一个周期的情形。问题计算结果为:两个周期内的损失的数额超过10 万元的可能性为3.65%;以95%的置信度保证损失的数额不会超过7.94万元;初始投资额最多应为1259 万元。5.1.2.3 T个周期的情况对于T 个周期情况而言,由引理可知该T 个周期之和也服从模型一的正态分布,为,计算的方法同理于以上的步骤,将该正态分布转化为标准正态分布后,进而求解,计算过程的表达式可以简要表示如下:5.2模型二(VaR模型)的分析与建立模型:按字面的解释就是“处于风险状态的价值”,即在一定置信水平和一定持有期内,某一金融工具或其组合在未来资产价格波动下所面临的最大损失额。Jorion则把定义为:“给定置信区间的一个持有期内的最大的可能损失”。 可以理解为在一定置信水平下,某一金融资产或证劵组合在未来特定时间内的最大可能损失,可表示为,其中为金融资产或证劵组合在持有期内的损失,为置信水平下处于风险中的价值。5.2.1 基本模型的建立根据Jorion(1996),可定义为:其中为资产组合下的预期价值;为资产组合下的期末价值;为置信水平下下投资组合的最低期末价值。其中为持有初期资产组合价值;为设定持有期内资产组合的效益率;为资产组合在置信水平下的最低收益率。将二者带入式得 公式即为资产组合的值,根据公式,如果能求出置信水平下的,即可求出该资产组合下的值。5.2.2 模型计算方法方差-协方差法方差-协方差法是运用历史资料,计算资产组合的值。其基本思路为:首先,利用历史数据计算资产组合的收益的方差、标准差、协方差;其次,假定资产组合收益是正态分布,可求出在一定置信水平下,反映了分布偏离均值程度的临界值;第三,建立与风险损失的联系,推导值。设某一资产组合在单位时间内的均值为,标准差为,又设a为置信水平下的临界值,根据正态分布的性质,在概率水平下,可能发生的偏离均值的最大距离为,即 根据 有假设持有期为 ,则均值和数准差分别为和 ,这时上式则变为: 5.2.3 利用模型求解5.2.3.1 一个周期的情况估计下一个周期(如一天)内的损失数额超过10万的可能性:另=10, =1化为标准正态分布查表得=0.0380,因此下一个周期(如1 天)内的损失的数额超过10 万元的可能性为3.80%; 求以95%的置信度保证损失的数额的上限:令,则=8.72,因此以95%的置信度保证损失的数额不会超过8.72万元。要求在一个周期内的损失超过10 万元的可能性不大于5%,初始投资额最多上限:由第二问已经求出以95%的置信度保证损失的数额不会超过8.72万元,根据假设(5)可求得最多损失10万元的投资额应为1147万元。5.2.3.2 两个周期的情况对于两个周期而言,令,则:估计下二个周期(如2 天)内的损失的数额超过10 万元的可能性为3.65%;求以95%的置信度保证损失的数额的上限为7.94 万元;要求在二个周期内的损失超过10 万元的可能性不大于5%,初始投资额最多上限为1259 万元。D=5.2.3.3 T个周期的情况对于T个周期而言,令,则:。即初始投资额为M , 限定损失额为L , 置信度为 , T 个周期,有如下通用模型二的表达式(r为参数):六、模型比较模型一和模型二考虑问题的方向不同。模型一方法较为普遍,将255个收益额看成数理统计中样本观测值,将其绘制成散点图,估计收益额样本服从的分布,建立模型,进而用基础的概率论与数理统计知识加以解决,思路清晰,求解也较为简便;模型二结合金融风险评价VaR 模型对问题进行详细的阐释,VaR 模型实用性更强,对投资的指导意义在于:人们可以利用计算机对大量风险投资的历史数据进行处理,通过对历史数据的分析研究,预测出资产的平均收益率和风险置信度,根据模型可以计算出投资的置信度区间,从而可以使投资者更好的衡量投资范围和投资风险。另外,两组模型对问题解决的结果基本相同,通过结果对比,可检验模型算法的正确性。同时VaR模型还可以对组合投资的决策提供了重要的启示和指导:为了减小风险,增加置信度,投资者应该尽量获得完整的历史投资信息,以作出合理的预测。这些在实际投资中被总结出来的重要经验,在模型中都得到了不同程度的反映。七、结论本文根据历史收益额数据分别建立正态分布模型(模型一)和VaR模型(模型二),在对模型中的各个参数进行求解后,在模型建立中已得出了两种模型各自的通用表达式,针对题中所给出的关于预测收益的可能性及以一定置信度为基础进行损失分析的问题,分别用两种模型进行求解,为投资作出合理的决策参考,这两个从不同角度出发考虑问题的模型对问题解决的结果基本相同,说明模型具有可靠度和稳定性。但是,在实际的投资市场中,各种风险资产之间也是有一定关联的。例如:同时在两个投资市场投资,实际风险要高于这两个投资风险中的任何一个,可以选用所有投资中风险最大的代表混合投资的风险,而本文没有体现出这一点,这也降低了模型的合理性。八、参考文献1 赵静,但琦数学建模与数学实验M,北京:高等教育出版社,2008 2 印成凡,夏乐天概率论与数理统计M,南京:河海大学出版社,2004 3 庄光明, 彭作祥, 王庆平. VAR 模型计算方法及应用J, 重庆工学院学报( 自然科学),2008,22(4):54-57