《课件第3章 数据统计分析.pptx》由会员分享,可在线阅读,更多相关《课件第3章 数据统计分析.pptx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.1参数估计3.2假设检验3.3方差分析3.4相关与回归分析第第 3 章章数据统计分析数据统计分析3.1 参参 数数 估估 计计3.1.1 抽样推断与抽样分布3.1.2 参数估计基本方法3.1.3 总体均值区间估计3.1.4 正态总体方差的区间估计3.1.5 总体成数区间估计3.1.6 样本容量确定3.113.11抽样推断与抽样分布抽样推断与抽样分布1. 1.什么是抽样推什么是抽样推断断 抽样推断是按照随机性原则,从研究对象中抽取一部分个体进行观察,并根据所得到的 观察数据,对研究对象目的的一种统计方法。2. 2.抽样推断中的基本概念抽样推断中的基本概念1) 总体与样本2) 样本容量与样本个
2、数3)总体参数与样本统计量4)重复抽样与不重复抽样(放回抽样和不放回抽样)3 3抽样分抽样分布布1)1) 样本平均数的抽样分样本平均数的抽样分布布(1)重置抽样平均数具有两个重要结论。 重置抽样的样本平均数的平均数(数学期望)等于总体平均数 重置抽样的样本平均数的标准差反映了样本平均数与总体平均数的平均误差程度。 (2)对于不重置抽平均数,也具有类似的两个重要结论。 不重置抽样的样本平均数的平均数(数学期望)等于总体平均数 样本平均数的标准差反映了样本平均数与总体平均数的平均误差程度2) 2) 样本成数的抽样分布样本成数的抽样分布(1)样本成数的平均数就是总体成数(2)对于重置抽样的样本成数的
3、标准差反映了样本成数与总体成数的平均差异,故也称为抽样平均误差3) 3) 抽样分布定理抽样分布定理(1)样本平均数的抽样分布定理 正态分布再生定理和中心极限定理(2) 样本成数的抽样分布定理4 4常用统计量分布常用统计量分布1)样本均值的分布2) 2 分布3)t 分布4)F 分布663.1.2 参数估计基本方法参数估计基本方法1估计量与估计估计量与估计值值参数估计就是用样本统计量去估计总体参数。2点估计与区间估点估计与区间估计计参数估计的方法主要有两种,一种是点估计,即选择一个适当的统计量作为总体未知参 数的估计量;另一种为区间估计,即选择一个适当的区间范围,使得总体未知参数以一定的概率被这个
4、范围所包含3 3评价估计量的标评价估计量的标准准1)无偏性2)一致性3)有效性3.133.13总体均值区间估计总体均值区间估计1. 1.区间估计的基本原区间估计的基本原理理 总体参数区间估计的基本原理是根据给定的概率保证程度的要求,利用实际抽样资料, 指出总体估计值的上限和下限,即指出总体参数可能存在的区间范围2总体平均数的区间估计总体平均数的区间估计1) 单个总体平均数的区间估计2) 两正态总体平均数差的区间估计3.14 3.14 正态总体方差的区间估计正态总体方差的区间估计1.单个正态总体方差的区间估计单个正态总体方差的区间估计2.2.两正态总体方差比的区间估计两正态总体方差比的区间估计3
5、.1.5总体成数区间总体成数区间估估3.163.16样本容量确定样本容量确定 影响必要样本容量的因素 主要有以下几种:总体各单位标志变异程度,即总体方差的大小,总体标志变异程度越大, 要求样本容量要大些,反之则相反;抽样极限误差的大小,抽样极限误差越大,容量越小,反之则相反;抽样方法,在其他条件相同时,重复抽样比不重复抽样要求样本容量大些;抽样推断的概率保证程度的大小,概率越大,要求样本容量越大,反之则相反。1.估计总体平均数时样本容量的确定2.估计总体成数时样本容量的确定3.确定样本容量时应注意的问题p733.2 假假 设设 检检 验验 假设检验是统计推断的重要内容,它是利用样本资料计算统计
6、量的取值,以此来检验事先对总体某些数量特征所作的假设是否成立,并做出判断或决策的一种统计方法。3.2.1 假设检验基本问题3.2.2 总体平均数检验3.2.3 正态总体方差假设检验3.2.4 总体成数检验733.213.21假设检验基本问题假设检验基本问题1.假设检验的概念假设检验的概念1)什么是统计假设假设检验就是对假设进行检验,假设检验中的假设是指统计假设,是关于总体的某种猜 或判断。2)假设检验的基本原理假设检验的基本原理就是所谓小概率事件原理,即小概率事件在一次试验中几乎是不会发生的。3) 假设检验的概念利用样本资料来检验关于总体某个假设的真伪并做出拒绝或接受该假设决策的统计方法,称为
7、假设性检验。732 2假设检验的步骤假设检验的步骤1) 建立假设假设包括两个部分,一个为原假设,一个为备择假设。2) 确定适当的检验统计量3) 规定显著性水平 4) 计算检验统计量的值5) 做出统计决策3 3双侧检验和单侧检双侧检验和单侧检验验假设检验究竟是使用双侧检验还是单侧检验, 单侧检验时是使用左单侧还是右单侧检验,这取决于备择假设的性质。4 4假设检验中的两类错假设检验中的两类错误误一是当原假设为正确时,却拒绝了原假设,这种错误称为“弃真”错误;二是当原假设是错误时,却接受了原假设,称为“取伪”错误。3.223.22总体平均数检验总体平均数检验1.大样本情形下的总体平均数的检大样本情形
8、下的总体平均数的检验验1) 总体方差已知2) 总体方差未知2.2.大样本情形下的总体平均数的检大样本情形下的总体平均数的检验验1) 总体方差已知2) 总体方差未知3 3两个正态总体均值之差的检验两个正态总体均值之差的检验3.2.4总体成数检验 成数是指具有某种特征的总体单位的个数在总体单位总数中所占的比重,总体成数通常P 表示。在大样本情况下,并且满足 np5 时833.3 方方 差差 分分 析析3.3.1 方差分析概念和意义3.3.2 单因素方差分析3.3.3 无交互作用的双因素方差分析833.313.31方差分析概念和意义方差分析概念和意义1. 1.方差分析的概方差分析的概念念 方差分析就
9、是分析推断各种因素的不同状态对所观测对象是否显著的一种统计分析方法。2. 2.方差分析的意方差分析的意义义 目前,方差分析不仅在农业科学实验和农业生产中有着广泛应用,而且在工业产品的试制与配方以及物理与化学实验,乃至生物学和医学等自然科学领域中发挥重要作用.833.3.2 3.3.2 单因素方差分析单因素方差分析1. 1.单因素方差分析的意义和统计假设单因素方差分析的意义和统计假设 在方差分析中,影响观测变量的因素也称为因子,因素的多种不同状态称为水平。影响观测变量的因素有许多,如果只就某一个因素进行观测,即在其他条件都保持不变的情况下,对某一个特定因子的各种不同水平的影响作用进行统计分析,就
10、称为单因素方差分析2单因素方差分析的过程和方法单因素方差分析的过程和方法1)分解总离差平方和2)计算方差,进行 F 检验3) 列出方差分析表833.3.3 3.3.3 无交互作用的双因素方差分析无交互作用的双因素方差分析1 1无交互作用双因素方差分析的数据结构和模型无交互作用双因素方差分析的数据结构和模型2 2假设检验假设检验 无交互作用的双因素方差分析是检验和判断因素A和因素B分别对观测变量的影响是否显著的统计方法。其假设检验原理与单因素方差分析相同。833双因素方差分析双因素方差分析表表733.4 相关与回归分析相关与回归分析3.4.1 相关分析3.4.2 一元线性回归3.4.3 多元线性
11、回归3.4.4 非线性回归733.4.1 3.4.1 相关分析相关分析1相关关系的概念和种类相关关系的概念和种类1) 相关关系概念变量与变量之间的相互关系,可以分为两种类型,即函数关系和相关关系。相关关系是指变量之间客观存在的不确定的依存关系,即一个变量的取值不能由另一个变量唯一确定,变量之间不存在一一对应的确定性关系2) 相关关系的种类相关关系可以按不同的标志加以区分。(1) 按相关的程度可分为完全相关、不完全相关和不相关(2) 按相关的方向可分为正相关和负相关。(3) 按相关的形式可分为线性相关和非线性相关。(4) 按相关关系涉及的变量或因素多少可分为单相关、复相关和偏相关2相关关系的判断
12、与测度相关关系的判断与测度1) 相关表和相关图2) 相关系数的概念和计算 为了精确地描述变量之间相关关系的密切程度,有必要用一个统计指标来刻画和说明,这个指标就是相关系数。 样本相关系数的计算公式为833.4.2 3.4.2 一元线性回归一元线性回归1. 1.回归分析的概念和特点回归分析的概念和特点 回归分析是指对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型(称为回归方程式),用来近似地表示变量之间平均变化关系的一种统计方法 回归分析则是对具有相关关系的变量建立一个数学方程式(即回归方程)来描述变量之间具体的变动关系,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提
13、供一个重要的方法2一元线性回归模型的确定一元线性回归模型的确定 一元线性回归模型又称简单直线回归模型,它是根据成对的两个变量的数据,选取直线方程式,由自变量的变动来推算因变量变动的统计方法3 3回归直线的拟合程度回归直线的拟合程度 回归直线与各散点的接近程度,称为直线对观测数据的拟合程度或拟合度;拟合度的大小反映了样本观测值聚集在样本回归线周围的紧密程度判断回归模型拟合程度优劣最常用的数量尺度是决定系数(又称判定系数),它是建立在对 Y 的总变差平方和进行分解基础上的1) 变差的分解2) 估计标准误差834 4回归分析中的统计检验回归分析中的统计检验1)为什么要进行统计检验 第一,当我们根据取
14、得的数据(一般视为从某个总体中抽取的样本数据)拟合直线回归方 程时,首先要假设变量线性关系,都可以求出一个线性回归方程。但是这种假设是否成立,必须通过统计检验才能确认。 第二,样本回归线Y X i 中的两个系数 和 分别是对总体参数 和 的最小二乘估计,能否作为总体参数的估计也需要进行检验2)统计检验的内容(1) 回归方程的显著性检验。(1)回归系数的显著性检验5回归预回归预测测1) 回归预测的基本公式一元线性回归预测的基本公式为2) 预测误差(1)模型本身中的误差因素所造成的误差。(2)由于回归系数的估计值同其真值不一致所造成的误差。(3)由于自变量 X 的设定值同其实际值的偏离所造成的误差
15、(4) 由于未来时期回归系数发生变化所造成的误差3) 区间预测 式(3.4.30)给出了 Y 的单值预测或点估计,但是在许多场合,人们更关心的是对 Y 的区间预测或区间估计,也就是给出一个预测值的可能范围3.433.43多元线性回归多元线性回归1.1.多元线性回归模型的确定多元线性回归模型的确定设因变量 Y 与 X 1 , X 2 , X p 等 p 个自变量具有线性关系,多元线性回归模型的一般形式 Y 0 1 X 1 2 X 2 X(3.4.34)p p称 1 , 2 , 为 Y 对 X , X , X 的偏回归系数。2 2多元线性回归模型的判定系数和估计多元线性回归模型的判定系数和估计标准误差标准误差 计算方法原理与一元线性回归分析类似3 3多元线性回归的统计检验多元线性回归的统计检验1)回归方程的显著性检验2) 回归系数的显著性检验3.4.4非线性回归非线性回归 在实际问题中,许多回归模型的因变量 Y 与自变量 X 之间的关系不是线性形式,而是某种曲线,这时就需要拟合适当类型的曲线方程,在统计上称之为非线性回归或曲线回归。 非线性回归按自变量的个数也分为一元非线性回归和多元非线性回归
限制150内