回归分析预测法优秀PPT.ppt
《回归分析预测法优秀PPT.ppt》由会员分享,可在线阅读,更多相关《回归分析预测法优秀PPT.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 回来分析的基本概念 一.基本概念 1.回来分析的来由:20世纪初,英统计学家 F.Golden 探讨父子身高的遗传统计,高个子父母下一代比父亲更高的概率小于比他矮的概率,而矮个子父亲下一代比父亲高的概率大于比他矮的概率;且这两种高度父辈的后代,高度有向两种父辈平均身高靠拢的趋势,这种现象称为“回来”是一种自然界现象规律的提取。东森平台东森平台 2.回来分析 探讨变量之间的相互关系,把其中一些因素作为限制的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变更的均值描述它们的关系的分析,称为回来分析。即假定 y 与 x 相关,应有 y=f(x)若 x1,x2,xn个变
2、量影响y,应有 y=f(x1,x2,xn)明显,有一些问题必需解决 因素分析 现代社会中,任何一件事物与多个因素相关,如何选取主要因素,忽视次要因素,使建立的数学模型不因变量太多而困难,又能较好的抓住主要冲突。解决方法是求相关系数R 运动轨迹的模型 主要利用已知统计数据在图上打点进行视察分析,寻求一条最佳线路。接受最小二乘法,即在满足该条线路的模拟值与真值总平方误差ei2为最小的条件下,来求出模拟数学模型各参数。(为Gauss-Markov最佳线性与无偏估计量)相关性检验 目的是鉴别所求出的模型是否牢靠,方法:利用相关性检验准则进行检验 精确度:即探讨在确定置信度条件下的置信区间 预料:前面的
3、问题已解决,数学模型已经建立且牢靠,精度问题也已解决,利用持续性原则代入需预料的数据,并求出结果。二.方法分类 线性 线性 一元 多元 非线性 非线性其次节 一元线性回来预料 一.回来方程的建立 假定需预料的目标为 y,与之对应的因素 x,随机抽样,子样数为 n,通过图上打点作粗略估计已知的一组对应数据,初步定为线性关系,同时再考虑到随机因素,应有:yi=a+b xi+ei i=1,2,n (1)不考虑随机因素,应有:yi=a+b xi i=1,2,n (2)代(2)入(1),求得随机项 ei=yi yi=yi (a+bxi)(3)ei 称为残差 这表示,真值与模拟直线y=a+bx之间存在实际
4、误差 ei,累积平方误差为 Q=ei 2,称残差平方和,又称剩余平方和。反之,我们已知的是实际数据(xi,yi),从可能的无穷条模拟直线中选取某一条直线,使之模拟得最好,标准为Q=e2i最小。由(3)Q(a,b)=ei2=(yi a-bxi)2求极值点,应有:Q(a,b)a=0 及 Q(a,b)b=0 得出 (yiabxi)=0 (yiabxi)xi=0 求出a,b a=(1/n)yi -b=(xiyinxy)/(xi2nx2)记(xix)2=lxxx的离差平方和 (xix)(yi-y)=lxyx,y离差乘积和 则b可简记为 b=lxy/lxx,a=y(lxy/lxx)x a,b称回来系数 y
5、=a+bx 称线性回来方程。这种方法称为最小二乘法,又叫最小平方法OLS(Ordinary Least Square)二.一元线性回来方程的代表特性 1、ei =0,即残差和为0 2、回来直线过点(x,y)y=a+bx 即过数据重心。3、回来平均值等于离散平均值,即 =y i=1.n 三.相关检验 相关检验解决两大问题:x与y是否线性相关及相关强弱如何?它们之间相关显著性如何?1、y的离差平方和 lyy=(yiy)2 对于随意给定的xi,都有yi的波动,波动的大小可用yiy来评价,n次结果的总波动大小为lyy,数据分散程度。2、回来平方和 U=(y)2 对于随意给定的xi,yi与xi是人为给定
6、的线性变更而得到,它与实际的均值 必产生偏差,这种偏差是由回来而产生的,是回来偏差平方和U回来分散程度制定。3.残差平方和 Q=(yiy)2 实际值与模拟值产生的误差,由于yi 随xi变更的随机特性引起,模拟的好则残差平方和应尽可能小 lyy=Q+U 这个公式中:离差平方和lyy是不行变更的客观存在,且残差平方和Q尽可能小,故有U lyy效果好,即yi与xi之间存在强的线性关系。于是有定义:R2=U/lyy (0R 1)即 U=R2 lyy 由lyy=U+Q推出Q=(1R2)lyy 其中R称为相关系数。当R=0为不相关,R+1为强正相关,R-1为强负相关 这样,通过探讨相关系数R,可作出两个因
7、素之间是否具有线性相关关系,且能判其相关程度。相关程度的显著与不显著(即使相关性强,但某因素对另一因素的影响不大,即不显著,那么这种因素也是不重要的)有一个具体界限,这是R检验。由于抽样误差的影响,R达到的显著值与样本个数n有关,且取决于不同的显著性水平(或置信度),配成相关系数检验表,它们给出了在不同的n,a时,相关系数达到的最小值。四、精度:即是在确定的置信度条件下,求出相应的置信区间:(n0)当 a=4.6%时(yi 2s,yi+2s)a=0.27%时(yi 3s,yi+3s)其中 S=Q/(n2),称为剩余标准差。2004/10/11 五.预料 利用公式 =a+bx 对于随意确定的时间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 预测 优秀 PPT
限制150内