数学建模统计分析课件.ppt
《数学建模统计分析课件.ppt》由会员分享,可在线阅读,更多相关《数学建模统计分析课件.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学建模统计分析数学建模统计分析第1页,此课件共80页哦SPSS是软件英文名称的首字母缩写,原意为是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即,即“社会科学统计软件包社会科学统计软件包”。但是随着。但是随着SPSS产品服务领域的扩大和产品服务领域的扩大和服务深度的增加,服务深度的增加,SPSS公司已于公司已于2000年正式将英文全称更改年正式将英文全称更改为为Statistical Product and Service Solutions,意为意为“统计产品与服务解决方案统计产品与服务解决方案”,标志着,标志着S
2、PSS的战略方的战略方向正在做出重大调整。向正在做出重大调整。第2页,此课件共80页哦非专业统计人员的首选统计软件非专业统计人员的首选统计软件SPSS采用类似采用类似EXCEL表格的方式输入与管表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数理数据,数据接口较为通用,能方便的从其他数据库中读入数据。据库中读入数据。其统计过程包括了常用的、较为成熟的统计其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。过程,完全可以满足非统计专业人士的工作需要。第3页,此课件共80页哦SPSS的的功能功能v样本数据的描述和预处理;样本数据的描述和预处理;v假设检验假设
3、检验(包括参数检验、非参数检验及其他检验包括参数检验、非参数检验及其他检验););v方差分析方差分析v相关分析相关分析v回归分析回归分析v聚类分析聚类分析v判别分析判别分析v因子分析因子分析v时间序列分析时间序列分析v可靠性分析可靠性分析第4页,此课件共80页哦应用应用广泛的应用于统计、应用数学、经济、市场营销、心广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。理、卫生统计、生物、企业管理、气象、社会学等领域。其分析过程包括:调查设计、数据收集、数据存取和管理、其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据
4、展示等。还有一系列附数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。统计分析功能及各种报表方法。第5页,此课件共80页哦SPSS的窗口类型的窗口类型v数据编辑窗口数据编辑窗口v程序编辑窗口程序编辑窗口v输出窗口输出窗口v简式输出窗口简式输出窗口第6页,此课件共80页哦1、数据编辑窗口、数据编辑窗口:(:(1)启动)启动SPSS直接进入直接进入 (2
5、)文件)文件新建新建数据文件数据文件 File/New/Data第7页,此课件共80页哦 2、程序编辑窗口:、程序编辑窗口:文件文件新建新建语句文件语句文件 File/New/Syntax第8页,此课件共80页哦3、输出窗口:、输出窗口:现实统计方法运行输出的结果,对输出结果可以进行模块裁剪、编现实统计方法运行输出的结果,对输出结果可以进行模块裁剪、编辑、存档等辑、存档等第9页,此课件共80页哦第第1节节 描述统计描述统计v设设变变量量X X有有一一组组观观测测数数据据x x1,1,x,x2 2,,x xn n,常常用用的的描述统计量有:描述统计量有:(1 1)中心趋势:平均值、中位数、众数、
6、和)中心趋势:平均值、中位数、众数、和(2 2)离中趋势:方差、标准差、最大最小值、)离中趋势:方差、标准差、最大最小值、极差极差(3 3)百分位数:四分位数、)百分位数:四分位数、给定间距的等间距分位数给定间距的等间距分位数(4 4)分布度统计量:偏态度、峰态度)分布度统计量:偏态度、峰态度第10页,此课件共80页哦v利利用用频频数数分分析析可可以以方方便便地地对对数数据据按按组组进进行行归归纳纳整整理理,对对变变量量的的数数据据有有一一个个整整体体上的认识。上的认识。(1)建立数据文件:例)建立数据文件:例1.sav(2)选择统计方法:)选择统计方法:AnalyzeDescriptiveS
7、tatisticsFrequencies,送入变量,点击确定,送入变量,点击确定(3)输出结果:)输出结果:例例1:对某大学:对某大学10名学生测量他们的血压名学生测量他们的血压x,得到如下数据:,得到如下数据:120120120134128102130132126126第第2节节 频数分析频数分析第11页,此课件共80页哦其他:描述统计分析其他:描述统计分析Descriptive等等,图表,图表第12页,此课件共80页哦SPSS统计图统计图第13页,此课件共80页哦SPSSSPSS统计图统计图1 1单个变量的频数统计图单个变量的频数统计图例例2 2:测量:测量3030株小麦的株高株小麦的株高
8、x x得到如下数据(单位:得到如下数据(单位:cmcm):例):例2.sav2.sav(1)(1)频数直方图频数直方图(加上一条正态曲线,直观比较频数图与正态分布的差异程度。)加上一条正态曲线,直观比较频数图与正态分布的差异程度。)(2)(2)频数连线图:简单频数连线图:简单2 2两个变量的统计图两个变量的统计图对两个变量(对两个变量(x,y)x,y)的样本,作图观察两个变量的关系的样本,作图观察两个变量的关系例例3 3 某研究所对某研究所对200200只北京鸭进行实验,得到的周龄(只北京鸭进行实验,得到的周龄(x x)与平均日增重()与平均日增重(y y)的数)的数据,对(据,对(x,yx,
9、y)作出散点图,拟合线)作出散点图,拟合线SmootherSmoother第14页,此课件共80页哦条图条图散点图散点图线图线图直方图直方图饼图饼图面积图面积图箱式图箱式图正态正态Q-QQ-Q图图正态正态P-PP-P图图质量控制图质量控制图ParetoPareto图图自回归曲线图自回归曲线图高低图高低图交互相关图交互相关图序列图序列图频谱图频谱图误差线图误差线图统计图汇总统计图汇总第15页,此课件共80页哦第第3 3节节 参数参数检验检验与置信区与置信区间间提出原假设:提出原假设:选择统计方法:选择统计方法:AnalyzeMeansOne-simpleTtest,在底部,在底部Testvalu
10、e框输入检验值框输入检验值100具体判断:具体判断:根据t分布计算出显著性概率(在许多书中称为P值),SPSS中为sig.对于给定的显著性水平 ,若sig.0.05,接受,接受H0;平均差平均差95%的置信区的置信区间为间为(-0.954,0.910),),则则均均值值的的95%置信区置信区间为间为(100-0.954,100+0.910)第17页,此课件共80页哦均数间的比较均数间的比较Compare MeansCompare Means菜单详解菜单详解v1 1MeansMeans过程过程求分类变量的综合描述统计量,目的在于比较v2 2One-Samples T TestOne-Sample
11、s T Test过程过程检验单个变量的均值是否与给定的常数之间存在差异。v3 3Independent-Samples T TestIndependent-Samples T Test过程过程 检验两个不相关的样本来自具有相同均值的总体,例如想知道购买某产品的顾客与不购买该产品的顾客的平均收入是否相同。v4 4Paired-Samples T TestPaired-Samples T Test过程过程检验两个相关的样本是否来自具有相同均值的总体。常用与被观测对象在实验前后是否有差异。v5 5One-Way ANOVAOne-Way ANOVA过程过程单因素方差分析,在下节介绍。第18页,此课件
12、共80页哦第第4节节 方差分析方差分析第19页,此课件共80页哦方差分析概述方差分析概述一个事物的变化总是某些因素影响的结果。例如,某种农作物一个事物的变化总是某些因素影响的结果。例如,某种农作物的收获量受到种子品种、土质、施肥量以及气候等因素的影响。在的收获量受到种子品种、土质、施肥量以及气候等因素的影响。在众多因素中,有些因素影响大些,有些则小些。在现实生活中常常众多因素中,有些因素影响大些,有些则小些。在现实生活中常常要找到有显著影响的那些因素,以便更有效地组织生产。要找到有显著影响的那些因素,以便更有效地组织生产。方差分析从分析数据的差异入手,分析哪些因素是影响数据差异方差分析从分析数
13、据的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素的众多因素中的主要因素.第20页,此课件共80页哦方差分析概述方差分析概述v 方差分析正是要分析观测变量的变动主要是由控制因素造成的还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的.相关概念相关概念:(1)观测变量观测变量:作为观测的对象作为观测的对象(如:亩产量、推销量等如:亩产量、推销量等).(2)控制因素:人为可以控制的因素控制因素:人为可以控制的因素(如如:施肥量、品种、推销策略、价格、包装方施肥量、品种、推销策略、价格、包装方式等式等),在方差分析中称为控制因素,在方差分析中称为控制因素.将控制变量的
14、不同情况称为控制变量的不同水将控制变量的不同情况称为控制变量的不同水平平.(3)随机因素:人为很难控制的因素随机因素:人为很难控制的因素(如如:气候、推销人员的形象、抽样误差等气候、推销人员的形象、抽样误差等),方,方差分析中主要指抽样误差。差分析中主要指抽样误差。第21页,此课件共80页哦核心问题核心问题v从数据差异角度看从数据差异角度看:观测变量的数据差异(ST)=控制因素不同水平造成(组间差异SB)+随机因素造成(组内差异SW)当控制因素对实验结果有显著影响时,和随机因素共同作用必然使观测变量产生显著变动;反之,观测变量的变动较小,将归结为随机性造成的(这里指抽样误差造成的).第22页,
15、此课件共80页哦方差分析概述方差分析概述方差分析概述方差分析概述方差分析的类型方差分析的类型v 单因素方差分析单因素方差分析:只考虑一个控制因素的影响v多因素方差分析多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响v协方差分析:协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)第23页,此课件共80页哦例例5 用四种饲料喂猪,共用四种饲料喂猪,共19头猪分为头猪分为4组,每组用一种饲料。一段时间组,每组用一种饲料。一段时间后沉重,猪体重增加数据(见下表)比较四种饲料对猪体重增加的作后沉重,猪体重增加数据(见下表)比较四种饲料对猪
16、体重增加的作用有无不同。用有无不同。观测变量:观测变量:猪体重增加量;猪体重增加量;控制因素:控制因素:饲料饲料 该问题是考察饲料这一个控制因素的变化对猪体重增加是否有显著性影该问题是考察饲料这一个控制因素的变化对猪体重增加是否有显著性影响。通常把饲料因素响。通常把饲料因素A 的四个不同的变化,分别记为的四个不同的变化,分别记为A1、A2、A3、A4,成为,成为A的的4个不同水平。把观测变量记为个不同水平。把观测变量记为X,而第,而第i种饲料在第种饲料在第j次试验下增加的体重记为次试验下增加的体重记为xij,即因素的第,即因素的第i个水平的第个水平的第j次观测(试验)值为次观测(试验)值为xi
17、j,问因素问因素A的变化对观测变的变化对观测变量量X的变化的变化是否有显著性影响?是否有显著性影响?第24页,此课件共80页哦n ni ix3kx33x32x313x2kx32x22x212x1kx31x21观测值观测值x11j=1AkA3A2水平水平A1第25页,此课件共80页哦1、基本原理、基本原理v设 表示在水平 下观测值的真实平均值,则在 下每次观测结果应该是在真实平均值 的左右随机波动,这个随机波动量记为 ,因此,方差分析的数学模型为v ,;v其中 相互独立且,是在每个水平 下重复进行试验的次数,为未知。研究因素A的影响是否显著,归结不同水平下的总体是否具有相同的均值,也即要检验统计
18、假设:统计假设:v拒绝 则认为不同水平有显著性差异。v具体判断:根据具体判断:根据F分布计算出显著性概率分布计算出显著性概率sig.若若sig.F,拒绝原假设H0P值法:P,拒绝原假设H0P值法更灵活值法更灵活第28页,此课件共80页哦一维方差分析步骤一维方差分析步骤1 1、编辑数据文件:定义两个数值型变量,一个为因、编辑数据文件:定义两个数值型变量,一个为因素变量(也成为分组变量)素变量(也成为分组变量)fodderfodder(饲料),要(饲料),要求是数值型变量,有四个不同水平求是数值型变量,有四个不同水平1 1,2 2,3 3,4 4;一个为观测变量一个为观测变量weightweigh
19、t(体重),输入数据。保(体重),输入数据。保存为:例存为:例5.sav5.sav2、选择统计方法:、选择统计方法:AnalyzeCompareMeansOne-WayANOVA将将weight送入因变量列框,将送入因变量列框,将fodder送入因子(因素)框,点击送入因子(因素)框,点击“确定确定”3、输出结果:、输出结果:sig.=0.0000.05,认为满足方差分析模型。,认为满足方差分析模型。第30页,此课件共80页哦v多重比较检验:两两不同水平进行比较,看是否有显著差多重比较检验:两两不同水平进行比较,看是否有显著差异。检验假设为无显著差异。异。检验假设为无显著差异。v选择选择Pos
20、t Hot按钮按钮v当方差齐性检验显著时,选当方差齐性检验显著时,选LSD;v当方差齐性检验不显著时,选当方差齐性检验不显著时,选Tamhanes T2,用,用t检验检验进行配对比较进行配对比较表中用*标示的组均值在0.05水平上有显著性差异第31页,此课件共80页哦v例例6 同种三叶草被接种上不同的菌种测量三叶草植物中的含氮量。每同种三叶草被接种上不同的菌种测量三叶草植物中的含氮量。每组数据中的前面一个是菌种代码,变量名是组数据中的前面一个是菌种代码,变量名是strain,数值型变量。后,数值型变量。后一个是含氮量一个是含氮量nitrogen。分析不同细菌对三叶草含氮量的影响。(数。分析不同
21、细菌对三叶草含氮量的影响。(数据例据例6.sav)第32页,此课件共80页哦第33页,此课件共80页哦练习练习1v对对6种不同的农药在相同的条件下分别进行杀虫试验,试验结果(杀虫率)种不同的农药在相同的条件下分别进行杀虫试验,试验结果(杀虫率)如下表:如下表:农药试验号A1A2A3A4A5A61879056559275285886248997238087958149491v问杀虫率是否因农药的不同而有显著性的差异(显著性水平为问杀虫率是否因农药的不同而有显著性的差异(显著性水平为0.01)?)?第34页,此课件共80页哦v数据文件:练习数据文件:练习1.savv选择方法:一维方差分析,方差齐性
22、检验,多重选择方法:一维方差分析,方差齐性检验,多重比较检验比较检验LSDv结果分析:方差是齐性的,不同农药的杀虫率有结果分析:方差是齐性的,不同农药的杀虫率有显著性差异显著性差异第35页,此课件共80页哦单因变量多因素方差分析单因变量多因素方差分析温度B浓度AB1B2B3B4A121,2322,2325,2327,25A223,2526,2428,2726,24A326,2329,2724,2524,23v对一个独立变量是否受到多个因素或变量影响而进行的方差分析,在这个过程中,对一个独立变量是否受到多个因素或变量影响而进行的方差分析,在这个过程中,可以分析每一个因素的作用,也可以分析因素之间
23、的交互作用。可以分析每一个因素的作用,也可以分析因素之间的交互作用。v例例7 7 在某化工厂产品的生产过程中,对三种浓度、四种温度的每一种在某化工厂产品的生产过程中,对三种浓度、四种温度的每一种搭配重复试验搭配重复试验2 2次,测得产量如下表。试检验不同的浓度,不同的温度次,测得产量如下表。试检验不同的浓度,不同的温度以及它们之间的的交互作用对产量有无显著性影响以及它们之间的的交互作用对产量有无显著性影响.(.(完全随机化设计)完全随机化设计)第36页,此课件共80页哦v编辑数据文件:例编辑数据文件:例7.savv选择方法:选择方法:AnalyzeGeneral Linear ModelUni
24、variate,送入变量送入变量v结果分析:浓度结果分析:浓度A因素的因素的sig.=0.0420.05,认为温度,认为温度对产量无显著性影响;对产量无显著性影响;A与与B的交互作用的交互作用a*b的的sig.=0.0160.05,age的的sig.=0.0000.001.因此因此得出结论,肺活量的差异是由于被试者的年龄差异所致,与得出结论,肺活量的差异是由于被试者的年龄差异所致,与被试者接触镉粉尘的时间是否大于被试者接触镉粉尘的时间是否大于10年无关。年无关。v参数估计值输出结果:参数估计值输出结果:age作为自变量,作为自变量,vitaclp作为因变量的线作为因变量的线性回归方程的斜率为性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 统计分析 课件
限制150内