《EXCEL第10-2章数理统计及应用.ppt》由会员分享,可在线阅读,更多相关《EXCEL第10-2章数理统计及应用.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具。第第1010章章 数理统计及应用数理统计及应用n 数理统计的基本概念n 描述性统计n 假设检验n 方差分析n 回归分析第第1010章章 数理统计及应用数理统计及应用 Excel 2007 能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括:n函数n数据分析工具第第1 1节节 数理统计的基本概念数理统计的基本概念 描述性统计分析主要包括两类:n数据集中趋势分析,表示数量的中心位置 (平均数、中位数)n数据的离散程度分析,表示数量的变异程度
2、 (极差、标准差)两者相互补充,共同反映数据的全貌。第第2 2节节 描述性统计描述性统计 总体均值的检验:总体均值的检验:n 单个样本的假设检验(统计函数)大样本(Z Z 检验检验)、小样本(t 检验检验)n 成对观测值的假设检验(数据分析工具)t 检验检验(平均值的成对二样本分析 双样本等方差、双样本异方差)方差检验:方差检验:F检验检验 Z 检验检验(方差已知)第第3 3节节 假设检验假设检验 1 1 方差分析的基本概念方差分析的基本概念 方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们的主要内容
3、包括单因素方差分析、双因素方差分析。第第4节节 方差分析方差分析 下面我们用一个简单的例子来说明方差分析的基本思想:第第4节节 方差分析方差分析该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉色橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、
4、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表。试分析饮料的颜色是否对销售量产生影响。p检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同p设 1为无色饮料的平均销售量,2粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设nH0:1 1 2 2 3 4 4 nH1:1 1,2 2,3,4 4 不全相等不全相等p检验上述假设所采用的方法就是方差分析 方差分析的应用条件方差分析的应用条件(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料
5、应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。第第4节节 方差分析方差分析 方差分析的步骤:方差分析的步骤:提出假设 构造检验统计量 统计决策第第4节节 方差分析方差分析 2 2 单因素方差分析单因素方差分析 若只考虑一个因素对试验指标的影响,而且用方差进行分析,这种方法被称为单因素方差分析(analysis of variance)方差分析简称“ANOVA”,该方法的主要目的是通过试验数据分
6、析推断因素A对试验指标影响是否显著,即当因素A、不同水平时试验指标有无显著差异。第第4节节 方差分析方差分析 2 2 单因素方差分析单因素方差分析 第第4节节 方差分析方差分析(Excel基本结构)F的函数,当p 时,拒绝原假设H0 平方和均方因素影响误差显著性水平的临界值F,若FF,则拒绝原假设H0,否则接受原假设H0。3 3 双因素方差分析双因素方差分析 许多实际问题中,对试验指标的影响不仅仅只有一个因素,可能需要同时考虑几个因素对试验指标的影响。这种同时分析多个因素对试验指标的影响作用大小并且使用方差进行问题分析的方法称为多因素方差分析,特别是若只考虑两个因素被称为双因素方差分析第第4节
7、节 方差分析方差分析双因素方差分析(无重复)(一个例子)不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据 品牌品牌(因素因素A)销售地区销售地区(因素因素B)B1B2B3B4B5A1A2A3A4365345358288 350368323280 343363353298 340330343260 323333308298【例例】有有四四个个品品牌牌的的彩彩电电在在五五个个地地区区销销售售,为为分分析析彩彩电电的的品品牌牌(因因素素A A)和和销销售售地地区区(因因素素B B)对对销销售售量量是是否否有有影影
8、响响,对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据,见见下下表表。试试分分析析品品牌牌和销售地区对彩电的销售量是否有显著影响?和销售地区对彩电的销售量是否有显著影响?双因素方差分析(无重复)(提出假设)1.对因素A提出的假设为H0:m1=m2=m3=m4 (品牌对销售量没有影响)H1:mi(i=1,2,4)不全相等 (品牌对销售量有影响)2.对因素B提出的假设为H0:m1=m2=m3=m4=m5 (地区对销售量没有影响)H1:mj(j=1,2,5)不全相等 (地区对销售量有影响)双因素方差分析(无重复)结论:结论:F FA A18.1077718.10777F
9、F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电,说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响 F FB B2.1008462.100846F F 3.25923.2592,接受原假设,接受原假设H H0 0,说明销售,说明销售地区对彩电的销售量没有显著影响地区对彩电的销售量没有显著影响双因素方差分析(有重复)【例例】有有一一牧牧草草栽栽培培实实验验,因因素素A A为为品品种种,因因素素B B为为收收获获期期,重重复复数数为为6 6,其其产产量量(吨吨/公公顷顷)如如下下表表。试试分分析析品品种种、收获期和交互作用产量是否有显著影响?收获期和交互作用产量是
10、否有显著影响?不同品种收获期产量不同品种收获期产量不同品种收获期产量不同品种收获期产量品种品种(因素因素A)收获期收获期(因素因素B)B1 B2B3 B4 A1 0.88,0.66,0.64,0.76,0.95,0.670.64,0.49,0.51,0.51,0.64,0.380.93,0.68,0.56,0.65,0.77,0.450.90,0.74,0.67,0.81,0.85,0.45A2 0.94,0.69,0.58,0.81,0.72,0.550.56,0.75,0.46,0.53,0.44,0.430.75,0.73,0.68,0.69,0.62,0.360.92,0.81,0.5
11、3,0.73,0.57,0.43A3 0.71,0.86,0.53,0.79,0.72,0.530.62,0.73,0.41,0.6,0.55,0.530.63,0.74,0.50,0.65,0.63,0.460.63,0.81,0.61,0.7,0.63,0.54双因素方差分析(有重复)(提出假设)1.对因素A提出的假设为H0:m1=m2=m3 (品种对产量没有影响)H1:mi(i=1,2,3)不全相等 (品种对产量有影响)2.对因素B提出的假设为H0:m1=m2=m3=m4 (收获期对产量没有影响)H1:mj(j=1,2,4)不全相等 (收获期对产量有影响)双因素方差分析(有重复)(提出假
12、设)3.对因素A和因素B交互作用提出的假设为H0:ij=0,(i=1,2,3,j=1,2,4)(品种和收获期的交互作用对产量没有影响)H1:至少有一个 ij 0,(i=1,2,3,j=1,2,4)(品种和收获期的交互作用对产量有影响)双因素方差分析(有重复)23第第5节节 回归与相关n 回归分析的基本概念n 使用Excel 2007 函数进行回归分析n 使用数据分析工具进行回归分析245.1 回归分析的基本概念 一、问题的提出 255.1 回归分析的基本概念 二、回归分析的基本概念 回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一
13、元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。265.1 回归分析的基本概念 三、回归分析的主要内容 1、从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法 2、对这些关系式的可信程度进行检验275.1 回归分析的基本概念 三、回归分析的主要内容 3、利用所求的关系式对某一生产过程进行预测或控制 回归分析的应用是非常广泛的,使用Excel 2007进行回归分析十分方便(图表、函数、工具)。285.2 使用函数进行回归分析 Excel提供了9个函数用于建立 回归模型和回归分析295.2
14、使用函数进行回归分析INTERCEPT一元线性回归模型的估计值(截距)SLOPE一元线性回归模型的估计值(斜率)RSQ一元线性回归模型的决定系数(r)FORECAST依照一元线性回归模型的预测值STEYX依照一元线性回归模型的标准误差TREND依照多元线性回归模型的预测值GROWTH依照多元指数回归模型的预测值LINEST估计多元线性回归模型的未知函数L0GEST估计多元指数回归模型的未知函数305.2 使用函数进行回归分析一元线性回归分析常用的函数:1、INTERCEPT功能:功能:利用已知的x值与y值计算直线与y轴的截距语语法:法:INTERCEPT(Y数据区域,X数据区域)2、SLOPE
15、功能:功能:返回线性回归模型的斜率语语法:法:SLOPE(Y数据区域,X数据区域)3、RSQ 功能:功能:返回线性回归模型的判定系数语语法:法:RSQ(Y数据区域,X数据区域)4、FORECAST功能:功能:根据线性回归模型返回一个预测值语法:语法:FORECAST(预测点,Y数据区域,X数据区域)315.2 使用函数进行回归分析例例如如:”家家有房”开发公司准备开发房产,但是要想开发房产必须要拿到建筑许可证,经过调查研究发现:建筑许可证数量主要与该地区人口的密度有关,调查结果见表。试建立一个能反映许可证颁发数量与人口密度之间的关系的回归模型,并预测当人口密度为7000时许可证的颁发数量325
16、.3 使用工具进行回归分析 例例如如:”家家有房”开发公司经过调查研究发现:建筑许可证颁发数量既与该地区人口的密度有关,也与自由房屋的均值有着密切的关系,同时与平均家庭收入也有关系,现要求建立一个模型,用来预测建筑许可证的颁发数量,并给出当每平方英里的人口密度为7000,自由房屋的均值为300,平均家庭收入为800千元时,预测出建筑许可证的颁发数量是多少?335.3 使用工具进行回归分析 步骤1:单击“数据”选项卡,选择“分析”组中“数据分析”按钮,则打开“数据分析”对话框,选择“回归”,弹出“回归”对话框 345.3 使用工具进行回归分析 步骤2:单击“确定”按钮,弹出“回归”对话框 355
17、.3 使用工具进行回归分析 步骤3:单击“确定”按钮,得回归分析结果 回归方程的显著性检验(步骤)2、计算检验统计量F3、确定显著性水平,找出临界值F4、作出决策:若FF,拒绝H0;若FF,接受H01、提出假设nH0:12p=0线性关系不显著nH1:1,2,p至少有一个不等于0回归系数的显著性检验(步骤)3、确定显著性水平,并进行决策 tt,拒绝H0;tt,接受H01、提出假设nH0:i=0 (自变量 xi与因变量y 没有线性关系)nH1:i 0 (自变量 xi与因变量y有线性关系)2、计算检验的统计量 t385.3 使用工具进行回归分析ExcelExcel回归分析工具的输出结果包括回归分析工
18、具的输出结果包括3 3个部分:个部分:u回归统计表回归统计表 回归统计表包括以下几部分内容:MultipleR(复相关系数R):又称为相关系数,用来衡量变量x和y之间相关程度的大小RSquare(复测定系数R2):用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果 395.3 使用工具进行回归分析ExcelExcel回归分析工具的输出结果包括回归分析工具的输出结果包括3 3个部分:个部分:u回归统计表回归统计表 回归统计表包括以下几部分内容:AdjustedRSquare(调整后的R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一
19、变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型,用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果 405.3 使用工具进行回归分析ExcelExcel回归分析工具的输出结果包括回归分析工具的输出结果包括3 3个部分:个部分:u回归统计表回归统计表 回归统计表包括以下几部分内容:标准误差:用来衡量拟合程度的大小,也用于计算与回归相关的其他统计量,此值越小,说明拟合程度越好观测值:用于估计回归方程的数据的观测值个数415.3 使用工具进行回归分析ExcelExcel回归分析工具的输出结果包括回归分析工具的输出结果包括3 3个部分:个部分:u方差分析表方差分析表 方差分析表的主要作用是通过F检验来判断回归模型的回归效果。回归分析行计算的是估计值同均值之差的各项指标;残差行是用于计算每个样本观察值与估计值之差的各项指标;“总计”行用于计算每个值同均值之差的各项指标425.3 使用工具进行回归分析ExcelExcel回归分析工具的输出结果包括回归分析工具的输出结果包括3 3个部分:个部分:u回归模型表回归模型表 43关于考试关于考试u考试时间:考试时间:11月24日周日上午(初定,最后以通知为准):10:00 11:10u考前辅导:考前辅导:11月19、20、22日 上午10:00 下午4:30 信电大楼572
限制150内