SPSS统计分析均值比较与T检验.pptx
《SPSS统计分析均值比较与T检验.pptx》由会员分享,可在线阅读,更多相关《SPSS统计分析均值比较与T检验.pptx(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。第1页/共44页由此可以得出这样的认识:均值不相等的两个样本不一定来自均值不同的总体。能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。第2页/共44页对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个
2、被比较的样本来自正态总体。两个样本方差相等与不等时使用的计算t值的公式不同。进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。p值小于说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。F值的计算公式是:FS12(较大)/S22(较小)第3页/共44页进行均值比较及检验的过程 lMEANS 过程lT test 过程 单一样本T检验 独立样本的T检验 配对样本的T检验l单因素方差分析第4页/共44页一、MEANS过程 MEANS过程计算指定变量的综合描述统计量。当观测量按一个分类变量分组时,MEANS过程可以进行分组计算。例如要计算学生的平均身高,SEX变量把学生按性别分
3、为男、女生两组,MEANS过程可以分别计算男、女生平均身高。用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。第5页/共44页 使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。还可以给出方差分析表和线性检验结果。第6页/共44页Mean过程的数据文件要求:至少有一个连续变量、一个分类变量(离散变量)。对连续变量求其基本描述统计量。分类变量用来分组。以27个学生的身高为例说明操作步骤(data11-
4、01)变量no编号,sex性别,age年龄,h身高,w体重。第7页/共44页第8页/共44页第9页/共44页ANOVA table and eta:输出第一层控制变量给出的方差分析表和eta统计值和2。统计量表明因变量和自变量之间联系的强度。2 是组间平方和与总平方和之比。Test for linearity:线性检验,输出R和R2,只有在控制变量有基本的控制级,且自变量有三个水平以上时才能选用。第10页/共44页第11页/共44页对第一层变量的方差分析结果身高*年龄(方差分析的变量信息):说明是分析不同年龄的身高均值间是否存在显著性差异;Sum of Squares(偏差平方和);df(自由
5、度);Mean square(均方);F(方差值);sig(P值);Between Groups(组间偏差平方和):由两部分组成:Linearity是由因变量与控制变量之间的线性关系引起的;Deviation from linearity不是由因变量与控制变量之间的线性关系引起的;Within Groups(组内偏差平方和):各组内的变异相对于组均值的变异;Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。第12页/共44页线性检验结果lR R是因变量身高的观测值与预测值之间的的相是因变量身高的观测值与预测值之间的的相 关系数,关系数,R R值越接近值越接近1 1 表明回归
6、方程的预测性表明回归方程的预测性 越好;越好;lEtaEta:即:即值(值(0 01 1)说明因变量与自变量之)说明因变量与自变量之 间的联系程度;间的联系程度;lEta SquaredEta Squared:22为组间偏差平方和与偏差为组间偏差平方和与偏差 平方和总和之比。平方和总和之比。第13页/共44页练习题已知97个被调查幼儿的体健资料并建立了数据文件。试按性别(X2)对身高(X5)与体重(X4)做平均数分析。数据文件在SP11DATA文件夹下第14页/共44页二、T test过程 1、单一样本T检验(One-sample T Test)检验单个变量的均值是否与给定的常数(一般为理论值
7、、标准值或经过大量观察所得的稳定值等)之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T检验。举例:已知某地区12岁男孩平均身高为。1973年某市测量120名12岁男孩身高资料。分析该市12岁男孩的身高与该地区平均身高有无明显差异。建立数据库(data11-02)第15页/共44页Confidence interval:95%:置信区间项,可以自定义。Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除;Exclude cases listwise:剔除所有列在Te
8、st、Grouping矩形框中的变量带缺失值的项第16页/共44页身高基本描述统计量第17页/共44页单样本T检验分析结果9595 Confidence Interval of the DifferenceConfidence Interval of the Difference(差值的95%95%置信区间):9595的置信区间均值标准误。根据上表9595置信区间是即之间。由此推出,改范围与总体均数之差为,即表中和的含义。实际上样本均值与总体均值之间的差值落在之间的占9595的范围包括0 0,由此得出样本均数与总体均数无显著性差异。也就是样本均数与总体均数之差与0 0无显著性差异。第18页/共
9、44页练习题已知某水样中含CaCO3的真值为,现用某方法重复测定该水样11次CaCO3的含量(mg/L)为:,。问该方法测得的均值是否偏高?第19页/共44页2、Independent Sample T test(独立样本T检验)独立样本的T检验用于检验是否两个不相关的样本来自具有相同均值的总体。必须注意使用这种检验的条件是必须具有来自两个不相关组(非配对)的观测量,其均值必须是对你想在两组中都计算的变量的综合测度。第20页/共44页如果分组样本彼此不独立,例如测量的是研究对象用药前后某项指标,要求比较用药前后某项指标均值是否有显著性差异,应该使用配对 T检验的功能(Paired Sample
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计分析 均值 比较 检验
限制150内