高级统计方法概论精选PPT.ppt
《高级统计方法概论精选PPT.ppt》由会员分享,可在线阅读,更多相关《高级统计方法概论精选PPT.ppt(110页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高级统计方法概论第1页,此课件共110页哦本章内容第一节 多重线性回归第二节 logistic回归分析第三节 生存分析第四节判别分析与聚类分析第五节 主成分分析与因子分析第六节 典型相关分析第2页,此课件共110页哦第一节第一节 多重线性回归多重线性回归一、应用范围:一、应用范围:生物医学现象的发生、发展和变化是多生物医学现象的发生、发展和变化是多种因素在一定条件下相互影响、相互制约产生的结果。例种因素在一定条件下相互影响、相互制约产生的结果。例如,影响原发性高血压发生的因素有年龄、性别、精神紧如,影响原发性高血压发生的因素有年龄、性别、精神紧张、劳动强度、吸烟状况、家族史等,这些因素中,哪些
2、张、劳动强度、吸烟状况、家族史等,这些因素中,哪些是主要因素,各因素的大小如何,往往是研究者关心的问是主要因素,各因素的大小如何,往往是研究者关心的问题。题。多重线性回归就是研究多个自变量与一个应变量间的线多重线性回归就是研究多个自变量与一个应变量间的线性依存关系的统计分析方法。性依存关系的统计分析方法。它可以从一组实际数据出发,研究多个自变量和一个应变它可以从一组实际数据出发,研究多个自变量和一个应变量之间是否存在线性依存关系,若存在则找出适当的定量关系量之间是否存在线性依存关系,若存在则找出适当的定量关系式,并对其进行参数估计和假设检验,从而推断哪些自变量对式,并对其进行参数估计和假设检验
3、,从而推断哪些自变量对应变量的影响是主要的,哪些是次要的,哪些是没有意义的;应变量的影响是主要的,哪些是次要的,哪些是没有意义的;并可利用回归方程对所研究的现象进行预测和控制并可利用回归方程对所研究的现象进行预测和控制第3页,此课件共110页哦二、应用条件条件二、应用条件条件第4页,此课件共110页哦建立回归方程建立回归方程(样本样本)(2)(2)对对回归方程回归方程及及各自变量各自变量做假设检验,并对方程的做假设检验,并对方程的拟拟合效果合效果及及各自变量的作用大小各自变量的作用大小做出评价。做出评价。(1)(1)求截距及偏回归系数求截距及偏回归系数三、多重线三、多重线性回归的一性回归的一般
4、步骤般步骤标准化偏回归系数标准化偏回归系数R2,等,等方差分析和方差分析和t检验检验第5页,此课件共110页哦四、自变量筛选四、自变量筛选 前述方程中包括的自变量是研究者根据专业知识和经验事前述方程中包括的自变量是研究者根据专业知识和经验事先选择好的。然而在许多实际应用中,由于没有清晰的理论依先选择好的。然而在许多实际应用中,由于没有清晰的理论依据,回归模型中包括的自变量难以预先确定,为了避免由于引据,回归模型中包括的自变量难以预先确定,为了避免由于引入一些不重要的自变量,而使模型的精度降低,因此选择有意入一些不重要的自变量,而使模型的精度降低,因此选择有意义的自变量常常是回归分析的第一步。义
5、的自变量常常是回归分析的第一步。基本思路:基本思路:尽可能将回归效果显著的自变量选入回归尽可能将回归效果显著的自变量选入回归方程中,作用不显著的自变量则排除在外。方程中,作用不显著的自变量则排除在外。模型的正确选择:模型的正确选择:根本依赖于所研究问题本身专业实践根本依赖于所研究问题本身专业实践第6页,此课件共110页哦自变量的筛选全局择优逐步选择调整R2CP统计量前进法后退法逐步回归法第7页,此课件共110页哦编号总胆固醇X1甘油三酯X2胰岛素X3糖化血X4血糖Y15.681.94.538.211.223.791.647.326.98.836.023.566.9510.812.344.851
6、.075.888.311.654.62.324.057.513.4273.841.26.459.610.427名糖尿病人的血糖及有关变量的测量结果五、实例分析五、实例分析第8页,此课件共110页哦ModelVariables EnteredVariables Removed1糖化血X4.2总胆固醇X1.3胰岛素X3.4甘油三酯X2.5.总胆固醇X1第9页,此课件共110页哦Model Summary(f)ModelRR SquareAdjusted R SquareStd.Error of the Estimate1.610(a).372.3472.365062.696(b).484.4412
7、.186723.740(c).547.4882.093514.775(d).601.5282.009545.773(e).598.5461.97213a Predictors:(Constant),糖化血b Predictors:(Constant),糖化血,总胆固醇c Predictors:(Constant),糖化血,总胆固醇,胰岛素d Predictors:(Constant),糖化血,总胆固醇,胰岛素,甘油三酯e Predictors:(Constant),糖化血,胰岛素,甘油三酯f Dependent Variable:血糖第10页,此课件共110页哦ANOVAModel Sum o
8、f SquaresdfMean SquareFSig.1Regression82.714182.71414.788.001(a)Residual139.837255.593 Total222.55226 2Regression107.790253.89511.271.000(b)Residual114.762244.782 Total222.55226 3Regression121.748340.5839.260.000(c)Residual100.804234.383 Total222.55226 4Regression133.711433.4288.278.000(d)Residual88
9、.841224.038 Total222.55226 5Regression133.098344.36611.407.000(e)Residual89.454233.889 Total222.55226 第11页,此课件共110页哦a Dependent Variable:血糖ModelBStd.ErrortFSS(XJ)SSESig.1糖化血糖化血.978.2543.84514.78882.714139.837.0012糖化血糖化血.732.2592.8338.026.009总胆固醇总胆固醇.678.2962.2905.24425.067114.762.0313糖化血糖化血.635.2532
10、.5076.285.020总胆固醇总胆固醇.545.2931.8613.463.076胰岛素胰岛素-.219.122-1.7853.18613.958100.804.0884糖化血糖化血.638.2432.6236.880.016总胆固醇总胆固醇.142.366.3900.1520.61388.841.701胰岛素胰岛素-.271.121-2.2294.968.036甘油三酯甘油三酯.351.2041.7212.96211.96388.841.0995糖化血糖化血.663.2302.8808.294.008胰岛素胰岛素-.287.112-2.5706.605.017甘油三酯甘油三酯.402.1
11、542.6126.823.016第12页,此课件共110页哦六、多重线性回归的应用六、多重线性回归的应用第13页,此课件共110页哦七、多重线性回归应用的注意事项七、多重线性回归应用的注意事项1 1 1 1、应满足、应满足、应满足、应满足LINELINELINELINE条件条件条件条件 残差图残差图2 2 2 2、指标的数量化、指标的数量化、指标的数量化、指标的数量化 分类变量的哑变量设置见分类变量的哑变量设置见P327P3273 3 3 3、样本含量、样本含量、样本含量、样本含量n=(5n=(5n=(5n=(510)m10)m10)m10)m。4 4 4 4、“最优最优最优最优”回归方程的意
12、义回归方程的意义回归方程的意义回归方程的意义所所谓谓的的“最最优优”回回归归方方程程并并不不一一定定是是最最好好的的,没没有有选选入方程的变量也未必没有统计学意义。入方程的变量也未必没有统计学意义。不同回归方程适应于不同用途,依专业知识定。不同回归方程适应于不同用途,依专业知识定。第14页,此课件共110页哦5 5 5 5、多多多多重重重重共共共共线线线线性性性性 即即即即指指指指一一一一些些些些自自自自变变变变量量量量之之之之间间间间存存存存在在在在较较较较强强强强的的的的线线线线性性性性关关关关系系系系。如如如如高高高高血血血血压压压压与与与与年年年年龄龄龄龄、吸吸吸吸烟烟烟烟年年年年限限
13、限限、饮饮饮饮白白白白酒酒酒酒年年年年限限限限等等等等,这这这这些些些些自自自自变变变变量量量量通通通通常常常常是是是是高高高高度度度度相相相相关关关关的的的的,有有有有可可可可能能能能使使使使通通通通过过过过最最最最小小小小二二二二乘乘乘乘法法法法建建建建立立立立回回回回归归归归方方方方程程程程失失失失效效效效,引引引引起起起起下下下下列列列列一些不良后果:一些不良后果:一些不良后果:一些不良后果:(1 1 1 1)参参参参数数数数估估估估计计计计值值值值的的的的标标标标准准准准误误误误变变变变得得得得很很很很大大大大,从从从从而而而而t t t t值值值值变变变变得很小。得很小。得很小。得
14、很小。(2 2 2 2)回回回回归归归归方方方方程程程程不不不不稳稳稳稳定定定定,增增增增加加加加或或或或减减减减少少少少某某某某几几几几个个个个观观观观察察察察值值值值,估计值可能会发生很大的变化。估计值可能会发生很大的变化。估计值可能会发生很大的变化。估计值可能会发生很大的变化。(3 3 3 3)t t t t检检检检验验验验不不不不准准准准确确确确,误误误误将将将将应应应应保保保保留留留留在在在在模模模模型型型型中中中中的的的的重重重重要要要要变量舍弃。变量舍弃。变量舍弃。变量舍弃。(4 4 4 4)估计值的正负符号与客观实际不一致。估计值的正负符号与客观实际不一致。估计值的正负符号与客
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 统计 方法 概论 精选 PPT
限制150内