多元统计分析及spss实现ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多元统计分析及spss实现ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元统计分析及spss实现ppt课件.ppt(135页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计分析及spss实现数理部 任铭为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 多元统计分析方法从研究问题的角度可以分为不同的类,相应有具体解决问题的方法。问题 内容 方法 数据或结构性化简 尽可能简单地表示所研究的现象,但不损失很多有用的信息,并希望这种表示能够很容易的解释。多元回归分析、聚类分析、主成分分析、因子分析、相应分析、多维标度法、可视化分析 分类和组合 基于所测量到的一些特征,给出好的分组方法,对相似的对象或变量分组。判别分析、聚类分析、主成分分析、可视化分析 变量之间的相关关系 变量之间是否存在相关关系,相关
2、关系又是怎样体现。多元回归、典型相关、主成分分析、因子分析、相应分析、多维标度法、可视化分析 预测与决策 通过统计模型或最优准则,对未来进行预见或判断。多元回归、判别分析、聚类分析、可视化分析 假设的提出及检验检验由多元总体参数表示的某种统计假设,能够证实某种假设条件的合理性。多元总体参数估计、假设检验 为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。本讲重点介绍常用的统计方法。这些方法包括聚类分析、主成分分析、因子分析、判别分析、对应分析、典型相关分析、方差分析、回归
3、分析等。典型统计赛题:葡萄酒评价(2012年A题)为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能葡萄酒评价(2012年A题)为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能内容提纲1、数据处理、数据处理2、描述性统计、描述性统计3、聚类分析、聚类分析4、主成分分析、主成分分析5、因子分析、因子分析6、判别分析、判别分析7、方差分析、方差分析8、回归分析、回归分析为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能
4、一、数据处理SPSS界面介绍界面介绍建立数据文件建立数据文件制图制图为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理SPSS界面介绍界面介绍数据编辑窗口数据编辑窗口为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理SPSS界面介绍界面介绍结果编辑窗口结果编辑窗口为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件建立数据文件定义变量定义变量数据录入数据录入数据文件的保存
5、数据文件的保存数据编辑数据编辑调用其它数据文件调用其它数据文件为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件:定义变量建立数据文件:定义变量 单击数据编辑窗口左下方的单击数据编辑窗口左下方的“Variable View”“Variable View”标签或双标签或双击题头(击题头(VarVar),进入变量定义窗口。可定义:),进入变量定义窗口。可定义:变量名(变量名(NameName)变量类型(变量类型(TypeType)变量长度(变量长度(WidthWidth)小数点位数(小数点位数(DecimalDec
6、imal)变量标签(变量标签(LabelLabel)变量值标签(变量值标签(ValuesValues)缺失值的定义方式(缺失值的定义方式(MissingMissing)变量的显示宽度(变量的显示宽度(ColumnsColumns)变量显示的对齐方式(变量显示的对齐方式(AlignAlign)变量的测量尺度(变量的测量尺度(MeasureMeasure)为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件:定义变量建立数据文件:定义变量 定义变量名(定义变量名(NameName)时,应注意:)时,应注意:(1 1)
7、变量名可为汉字或英文,英文的第一个字符必须为字)变量名可为汉字或英文,英文的第一个字符必须为字母,后面可跟任意字母、数字、句点或母,后面可跟任意字母、数字、句点或、#、_ _、$等;等;(2 2)变量名不能以句点结尾;)变量名不能以句点结尾;(3 3)定义时应避免最后一个字符为下划线)定义时应避免最后一个字符为下划线“_”“_”(因为某(因为某些过程运行时自动创建的变量名的最后一个字符有可能为些过程运行时自动创建的变量名的最后一个字符有可能为下划线);下划线);(4 4)变量的长度一般不能超过)变量的长度一般不能超过8 8个字符;个字符;(5 5)每个变量名必须保证是唯一的,不区分大小写。)每
8、个变量名必须保证是唯一的,不区分大小写。常用的变量类型(常用的变量类型(TypeType)包括:数值型、字符串型、日期)包括:数值型、字符串型、日期格式变量等。格式变量等。为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件:建立数据文件:数据录入数据录入直接录入直接录入调入数据:调入数据:excelexcel、记事本等、记事本等为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件:建立数据文件:保存保存选择选择“File”“Fil
9、e”菜单的菜单的“Save”“Save”命令,可直接保存命令,可直接保存为为SPSSSPSS默认的数据文件格式(默认的数据文件格式(*.sav*.sav)。)。选择选择“File”“File”菜单的菜单的“Save As”“Save As”命令,弹出命令,弹出“Save Data As”“Save Data As”对话框,可选择保存为对话框,可选择保存为ExcelExcel(*.xls*.xls)等文件格式。)等文件格式。为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理建立数据文件:建立数据文件:数据编辑数据编辑(1 1
10、)数据的排序:)数据的排序:数据数据排序个案排序个案 数据数据排列变量排列变量 (2 2)数据的转置:)数据的转置:数据数据转置转置 分割文件、重组、选择个案等分割文件、重组、选择个案等为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、数据处理制图制图主要通过主要通过“Graph”“Graph”菜单中的选项来创建图形菜单中的选项来创建图形为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计 例例2.1:数据:数据2.1给出了员工代码、性别、起始薪金、给出了员工
11、代码、性别、起始薪金、当前薪金等信息:当前薪金等信息:1.利用频率计算当前薪金的描述性统计量,并绘制利用频率计算当前薪金的描述性统计量,并绘制带正态检验的直方图;带正态检验的直方图;2.利用探索性分析不同性别员工当前薪金情况;利用探索性分析不同性别员工当前薪金情况;3.用比率分析比较不同性别员工的薪金增长率是否用比率分析比较不同性别员工的薪金增长率是否有较大差异;有较大差异;4.用用P-P图和图和Q-Q图检验当前薪金是否符合正态分布图检验当前薪金是否符合正态分布为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计1.利用频
12、率计算当前薪金的描述性统计量,并绘制带正态利用频率计算当前薪金的描述性统计量,并绘制带正态检验的直方图检验的直方图为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计1.利用频率计算当前薪金的描述性统计量,并绘制带正态利用频率计算当前薪金的描述性统计量,并绘制带正态检验的直方图检验的直方图为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计 2.利用探索性分析不同性别员工当前薪金情况利用探索性分析不同性别员工当前薪金情况 单击单击“分割文件分割文件”按
13、钮,将按钮,将“性别性别”指定为分组方式,指定为分组方式,选中选中“比较组比较组”,单击,单击“确定确定”分析分析描述统计描述统计描述,将描述,将“当前薪金当前薪金”指定为变量,指定为变量,单击单击“选项选项”按钮,选中所需统计量,单击按钮,选中所需统计量,单击“继续继续”,单击单击“确定确定”分析分析描述统计描述统计探索,将探索,将“当前薪金当前薪金”指定为因变量,指定为因变量,将将“性别性别”指定为因子,单击指定为因子,单击“绘制绘制”,选定,选定“直方图直方图”,单击,单击“继续继续”,单击,单击“确定确定”为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神
14、,充分发挥中小学图书室育人功能二、描述性统计 2.利用探索性分析不同性别员工当前薪金情况利用探索性分析不同性别员工当前薪金情况p值小于值小于0.05,通过,通过正态性检验,即认为正态性检验,即认为当前薪金分布服从正当前薪金分布服从正态分布态分布为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计3.用比率分析比较不同性别员工的薪金增长率是否用比率分析比较不同性别员工的薪金增长率是否有较大差异有较大差异分析分析描述统计描述统计比率,将比率,将“当前薪金当前薪金”指定为分子,指定为分子,将将“起始薪金起始薪金”指定为分母,将指
15、定为分母,将“性别性别”指定为组变量,指定为组变量,单击单击“统计量统计量”,选中:均值、置信区间、,选中:均值、置信区间、AADAAD、PRDPRD、CODCOD,单击,单击“继续继续”,单击,单击“确定确定”为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计3.用比率分析比较不同性别员工的薪金增长率是否用比率分析比较不同性别员工的薪金增长率是否有较大差异有较大差异为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、描述性统计 4.用用P-P图和图和Q-Q图
16、检验当前薪金是否符合正态分布图检验当前薪金是否符合正态分布 Q Q-Q Q图是一种散点图图是一种散点图,对应于正态分布的对应于正态分布的QQQQ图图,就是由标准就是由标准正态分布的分位数为横坐标正态分布的分位数为横坐标,样本值为纵坐标的散点图样本值为纵坐标的散点图.要利要利用用QQQQ图鉴别样本数据是否近似于正态分布图鉴别样本数据是否近似于正态分布,只需看只需看QQQQ图上的点图上的点是否近似地在一条直线附近是否近似地在一条直线附近,而且该直线的斜率为标准差而且该直线的斜率为标准差,截截距为均值距为均值.用用QQQQ图还可获得样本偏度和峰度的粗略信息图还可获得样本偏度和峰度的粗略信息.P-PP
17、-P图是根据变量的累积比例与指定分布的累积比例之间图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过的关系所绘制的图形。通过P-PP-P图可以检验数据是否符合指定图可以检验数据是否符合指定的分布。的分布。当数据符合指定分布时,当数据符合指定分布时,P-PP-P图中各点近似呈一条直图中各点近似呈一条直线。线。如果如果P-PP-P图中各点不呈直线,但有一定规律,可以对变量图中各点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。数据进行转换,使转换后的数据更接近指定分布。P-PP-P图和图和Q-QQ-Q图的用途完全相同,只是检验方法存在差异图的用途完
18、全相同,只是检验方法存在差异为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理;R型聚类是对变量进行分类处理。三、聚类分析聚类分析的概念及分类为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 在聚类之前,要首先分析样品(变量)间的相似性。p样品相似性度量(距离):即两个样品间相似程度就可用p维空间中的两点距离公式来度量。p变量相似性度量(夹角余弦、相关系数
19、)p相对于数据的大小,我们更关心变量的方向及相关性三、聚类分析相似性度量为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能三、聚类分析相似性度量几种距离为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能三、聚类分析相似性度量为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能三、聚类分析相似性度量3距离选择的原则距离选择的原则 一般说来,同一批数据采用不同的距离公式,会得到不同的分类结果。产生不同结果的原因,主要是由于
20、不同的距离公式的侧重点和实际意义都有不同。因此我们在进行聚类分析时,应注意距离公式的选择。通常选择距离公式应注意遵循以下的基本原则:(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。(3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚
21、类分析的结果进行对比分析,以确定最合适的距离测度方法。为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能三、聚类分析相似性度量为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 无论是夹角余弦还是相关系数,它们的绝对值都小于1,作为变量近似性的度量工具,我们把它们统记为cij。当cij=1时,说明变量Xi与Xj完全相似;当cij近似于1时,说明变量Xi与Xj非常密切;当cij=0时,说明变量Xi与Xj完全不一样;当cij近似于0时,说明变量Xi与Xj差别很大。据此,我们把比较
22、相似的变量聚为一类,把不太相似的变量归到不同的类内。在实际聚类过程中,为了计算方便,我们把变量间相似性的度量公式作一个变换为 dij=1 cij 或者 dij2=1 cij2 来表示变量间的距离远近,小则先聚成一类,这比较符合人们的一般思维习惯。三、聚类分析相似性度量为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 A)系统聚类法 B)K均值聚类法三、聚类分析常见聚类方法为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能A)系统聚类法系统聚类的基本思想是:距离相近的样品(或
23、变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。系统聚类过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,共聚成n 1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n 2类;,以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。为了直观地反映以上的系统聚类过程,可以把整个分类系统画成一张谱系图。所以有时系统聚类也称为谱系分析。三、聚类分析常见聚类方法为深入学习习近平新时代中国
24、特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能系统聚类法与聚类步骤流程图初始分类:若 与 距离最小,合并为一类no输出分类结果为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能B)K均值聚类系统聚类法需要计算出不同样品或变量的距离,还要在聚类的每一步都要计算“类间距离”,相应的计算量自然比较大;特别是当样本的容量很大时,需要占据非常大的计算机内存空间,这给应用带来一定的困难。而K均值法是一种快速聚类法,采用该方法得到的结果比较简单易懂,对计算机的性能要求不高,因此应用也比较广泛。K均值法是麦奎因(
25、MacQueen,1967)提出的,这种算法的基本思想是将每一个样品分配给最近中心(均值)的类中,具体的算法至少包括以下三个步骤:1将所有的样品分成K个初始类;2通过欧氏距离将某个样品划入离中心最近的类中,并对获得样品与失去样品的类,重新计算中心坐标;3重复步骤2,直到所有的样品都不能再分配时为止。三、聚类分析常见聚类方法为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能K-均值聚类法步骤流程图寻找k个凝聚点:若 则 ;得计算各类的重心:若 则 ;得计算各类的重心:重心改变输出分类结果yesno为深入学习习近平新时代中国特色社会主义思
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 spss 实现 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内