支持向量机在风险评估的运用实例--by-Seven(共8页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《支持向量机在风险评估的运用实例--by-Seven(共8页).doc》由会员分享,可在线阅读,更多相关《支持向量机在风险评估的运用实例--by-Seven(共8页).doc(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上支持向量机方法在风险评估的运用OK一、支持向量机介绍支持向量机(support vector machines)是由贝尔实验室研究者Vapnik于20世纪90年代最先提出的一种新的机器学习理论,是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。支持向量机从诞生至今才10多年,发展史虽短,但其理论研究和算法实现方面却都取得了突破性进展,有力地推动机器学习理论和技术的发展。这一切与支持向量机具有较完备的统计学习理论基础的发展背景密不可分。统计学习理论领域里把学习问题看作是利用有限
2、数量的观测来寻找待求的依赖关系的问题。而基于数据的机器学习问题,则是根据已知样本估计数据之间的依赖关系,从而对未知或无法测量的数据进行预测和判断。支持向量机方法是统计学习理论中最年轻的部分,目前仍处于不断发展阶段。支持向量机是从线性可分情况下的最优分类面发展而来的。其基本思想可用图3-3的两维情况说明。图3-3:支持向量机的分类面图3-3中,实心点和空心点代表两类样本,H为分类线,H1、H2分别为过两类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。所谓最优分类线就是要求分类线不但能将两类样本正确分开(训练错误率为0),而且使分类间隔最大,右图的H即为最优分类线。分类线方
3、程可以表示为xw+b=0,对它进行归一化,使得对线性可分的样本集(xi,yi),i=1,n,xRd,yi+1,-1,满足约束条件式(1)。此时分类间隔等于2/w,使间隔最大等价于使w2/2最小。满足条件公式(1)且使w2/2最小的分类面就叫做最优分类面,H1、H2上的训练样本点称作支持向量。因此,求最优分类面的问题转化为在不等式(1)的约束下式(2)的优化问题。利用Lagrange优化方法可以把上述求最优分类面问题化为其对偶问题,即求式(3)的最大值,约束条件为式(4),其中i为Lagrange乘子。这是一个不等式约束下二次函数寻优的问题,存在唯一解。解上述问题后得到的最优分类函数式(5)。式
4、(5)中的求和实际上只对支持向量进行。i*为i的最优解,b*是分类阈值,可以用任一个支持向量(满足公式(1)的等号)求得,或通过两类中任意一对支持向量取中值求得。上面的最优分类面是在线性可分的前提下讨论的,在线性不可分的情况下,考虑到可能存在一些样本不能被超平面正确分类,因此引入松弛变量i0,这样公式(1)的线性约束条件变为式(6)。此时优化问题变为(7);约束条件为(8)。式(7)中的常数C起着对错分样本的惩罚作用,实现的是学习机器泛化能力和错分样本数目之间的折中。以上都是在线性分界超平面的基础上进行的讨论,在很多问题中需要将其推广到非线性分类超平面中。SVM的非线性特性可以如下方式来解决,
5、把输入样本X映射到高维特征空间(可能是无穷维)H中,并在H中使用线性分类器来完成分类,即将X做变换:R(d)H,则前面的分析同样适用。当在特征空间H中构造最优超平面时,训练算法使用空间中的点积,即仅仅使用(xi)(xj),而没有使用单独的(xi)。因此,如果能够找到一个函数K使得k(xi,xj)=(xi)(xj),那么,在高维空间实际上只需进行内积运算,而这种内积运算是可以用原空间中的函数来实现的,甚至没有必要知道的形式。根据泛函的有关理论,只要一种核函数k(xi,xj)满足Mercer条件,它就对应某一变换空间中的内积。选择不同的内积函数K,就形成不同类型的算法,常用的内核函数有:多项式(P
6、olynomial)内核函数、Guass内核函数、Sigmoid内核函数等。二、基于支持向量机的高校财务综合风险预测本部分的数据来源于教育部直属76所高校的2009年财务年报数据。自变量为财务综合风险评估的15个因子,也是支持向量机的输入变量,因变量为高校财务综合风险。利用因子分析的总分和排名,将财务综合风险离散化。由于财务风险通常采用五级评价(很小、较小、一般、较大、很大),因此,将76所高校的F得分离散化,转化为1,2,3,4,5,分别表示财务风险很大、较大、一般、较小和很小:F值小于-0.5表示财务风险很大,用1表示;F值介于0- -0.5之间表示财务风险较大,用2表示;F值介于0-0.
7、2之间表示财务风险一般,用3表示;F值介于0.2-1之间表示财务风险较小,用4表示;F值大于1表示财务风险很小,用5表示。转换后发现,财务风险很大的高校11所,财务风险较大的高校31所,财务风险一般的高校12所,财务风险较小的高校17所,财务风险很小的高校5所。从每种财务风险中选取部分高校,合计抽取70所高校作为已知样本,剩余6所作为检验样本。表1:76高校财务风险的原始数据高校F1F2F3F4F5F6F7F8F9F10F11F12F13F14F15离散化F分区中央戏剧学院-1.85970.1478-1.76-0.83-2.232-0.825-2.3-0.4859-3.34231.0321-1
8、.4611.266-2.83-2.5570.5645910中国矿业大学(北京)-1.1844-0.407-1.64-1.09-1.399-0.364-2.1-1.552-2.1925-1.192-1.174-0.38-1.8-0.44-0.17910中央音乐学院-1.7834-0.342-1.75-0.58-1.7820.8378-2.3-0.9874-2.27121.0038-1.196-1.13-2.77-0.640.0862210北京中医药大学-0.9016-0.657-0.98-1.51-1.2190.2883-1.2-0.9544-1.1373-0.24-0.791-0.34-1.1
9、6-1.205-0.557910北京外国语大学-1.09870.1451-1.55-0.14-1.376-0.018-1.9-0.5152-2.1384-1.017-1.063-0.5-1.46-0.2511.2665510华北电力大学-0.98140.0327-1.38-0.78-1.319-0.411-1.6-1.1027-1.49250.5383-0.989-0.47-1.330.3-0.413411华北电力大学(保定)-0.9461-0.977-1.06-0.54-1.2280.1984-1.3-0.2208-1.4272-0.024-0.895-0.79-1.210.2250.120
10、4911中央美术学院-1.04930.0514-1.51-0.33-1.335-0.087-1.8-0.9915-1.8590.3165-1.021-0.63-1.34-0.2952.3552311北京化工大学-0.8132-1.119-0.93-1.24-1.012-0.16-0.8-0.0992-0.8382-0.105-0.5850.631-0.8-0.327-0.228211中国传媒大学-0.92321.1045-1.05-1.12-1.2260.0975-1.20.10757-1.2171-0.482-0.869-0.09-1.2-0.299-5.645211北京语言大学-0.834
11、4-0.25-0.950.175-1.0510.1407-1.1-0.8787-1.0693-0.523-0.75-0.33-0.850.1071-1.028911中国海洋大学-0.6636-1.056-0.74-0.68-0.7210.1587-0.5-0.0911-0.47881.6094-0.482-0.14-0.49-0.323-0.720620上海财经大学-0.3887-0.855-0.43-1.35-0.341-0.4-0.30.41605-0.1282-0.051-0.3960.139-0.28-2.5540.023520东北大学-0.5489-0.69-0.74-1.14-0.
12、655-0.438-0.50.06545-0.41270.5939-0.46-0.58-0.470.13521.1373220东华大学-0.7369-0.143-0.79-0.86-0.7940.7779-0.60.28579-0.62540.1122-0.53-0.42-0.66-0.95-0.39320中国药科大学-0.8154-0.566-0.941.544-1.0250.7228-0.9-0.4219-1.0662-2.131-0.6040.083-0.810.29241.4414420河海大学-0.79590.1769-0.910.261-0.882-1.077-0.8-0.4562
13、-0.79720.7148-0.5620.01-0.740.34060.0605420中央财经大学-0.97811.2616-1.14-0.37-1.295-0.098-1.4-0.5877-1.43020.0886-0.9651.401-1.221.3506-0.496120中国石油大学(北京)-0.7629-0.281-0.90.072-0.8580.2296-0.8-0.0561-0.77840.2122-0.5550.418-0.710.63020.6693920华中农业大学-0.6935-0.682-0.750.49-0.7430.3447-0.50.06224-0.50540.38
14、25-0.4890.211-0.52-0.407-0.350220南京农业大学-0.7445-0.016-0.86-0.15-0.8520.7841-0.8-0.2685-0.73980.7251-0.5530.087-0.710.1350.9730320北京林业大学-0.7427-0.067-0.830.217-0.7950.3764-0.7-0.1448-0.71781.7537-0.551-0.79-0.67-1.0911.4725520陕西师范大学-0.265-0.386-0.09-0.84-0.1660.17450.06-0.03910.05883-1.158-0.299-0.01-
15、0.06-0.302-0.722720对外经济贸易大学-0.5267-0.481-0.680.792-0.6310.0192-0.40.10399-0.36630.7671-0.4520.919-0.42-0.202-0.025720中国地质大学(北京)-0.8711-0.154-0.951.314-1.0730.814-1.12.16729-1.12771.2033-0.770.838-0.86-1.540.6611120中国地质大学(武汉)-0.51790.2595-0.480.136-0.562-0.403-0.3-0.4687-0.31860.5738-0.429-0.15-0.370
16、.6156-0.267120北京邮电大学-0.4082-0.054-0.45-0.24-0.4390.0516-0.3-0.8126-0.16050.5076-0.4010.732-0.290.12270.3657620中国政法大学-0.3394-0.605-0.32-1.15-0.2580.6512-0.21.44885-0.11020.3341-0.3630.559-0.231.1046-0.396221兰州大学-0.0357-0.5990.3122.0830.2883-6.7720.31.6740.52724-0.5230.0399-0.610.241-0.666-0.28821中南财经
17、政法大学-0.1033-0.5960.155-1.320.1523-0.4850.24-0.42870.38091.0535-0.072-0.420.17-0.4230.6371321北京科技大学-0.2689-0.302-0.17-0.32-0.214-0.4350.021.372150.03530.0298-0.314-0.39-0.120.1295-0.509921合肥工业大学-0.2904-0.482-0.180.326-0.218-0.055-0-0.9868-0.08141.0921-0.3390.815-0.16-0.7360.1648121南开大学-0.2318-1.108-0
18、.011.604-0.0120.60160.12-2.19190.24518-1.036-0.2120.9140.029-0.645-0.026921西北农林科技大学-0.1995-0.5180.0060.1020.0122-0.1820.13-0.44350.30995-0.005-0.183-0.140.033-0.1610.4991421西安电子科技大学-0.1046-0.5830.144-0.290.1146-0.3650.220.820170.361950.1866-0.134-0.520.17-1.151-0.043121江南大学-0.38860.0941-0.36-0.42-0.
19、3251.4663-0.23.27293-0.1210.1098-0.365-2.28-0.28-0.957-0.575921北京师范大学-0.524-1.129-0.581.283-0.5932.0543-0.40.77003-0.3411.4944-0.440.405-0.390.04050.1681621东南大学-0.19440.22170.039-0.660.01550.02220.14-0.59260.31636-0.756-0.176-1.810.0391.51881.5645621上海外国语大学-0.72310.9321-0.770.092-0.7740.1849-0.6-0.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 支持 向量 风险 评估 运用 实例 by Seven
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内