教育统计的理论与实践入门课件.ppt
教育统计的理论与实践入门第1页,此课件共27页哦研究主题研究主题能不能单纯利用算术平均数来比较不同班能不能单纯利用算术平均数来比较不同班级某科目成绩的高低?级某科目成绩的高低?怎么判断一个学生成绩的好坏?怎么判断一个学生成绩的好坏?学生数学成绩和物理成绩有没有关系,若学生数学成绩和物理成绩有没有关系,若有,又是什么关系?有,又是什么关系?第2页,此课件共27页哦能不能单纯利用算术能不能单纯利用算术平均数来比较两个班平均数来比较两个班某科目成绩的高低?某科目成绩的高低?两个班的平均成绩相同两个班的平均成绩相同 但两者分布情况却不同但两者分布情况却不同班级班级姓名姓名语文成绩语文成绩初三(初三(1 1)汪博文120孙运玺121王慧124刘太洲90黄圆美87闫家才86张宁93仲金118初三(初三(2 2)李玉洁115刘玉帅108徐志超110于绪禄102袁洪梅99于绪豹105吴召玲100仲其坤100第3页,此课件共27页哦结论描述两个样本的水平至少需要两个指标!描述两个样本的水平至少需要两个指标!集中变量:集中变量:对一组数据集中趋势的度量,就是确定描述这种数据特点的代表性的统计量。算术平均数是最为常用的集中变量。总体平均数用 来表示;样本平均数用M来表示。离散变量:离散变量:描述数据的离中(集中特征,例如算术平均数)趋势。常常用标准差来表示。总体标准差:样本标准差:S(SD)第4页,此课件共27页哦结论需要综合集中变量和离散变量两个指标进行两样本成绩高低的比较,(事实上主要还是要考虑抽样的误差)统计学中就是利用t检验来实现这种比较的。第5页,此课件共27页哦实例演练一实例演练一研究问题:研究问题:已知某初中2004-2005学年度第二学期期末考试,初二(1)班的平均总分为425分,初二(2)班的平均总分为422分。请问:两个班的成绩哪个好?最常见的反应:初二(1)班好。原因原因:样本大小离散程度单次测验的代表性样本大小离散程度单次测验的代表性第6页,此课件共27页哦科学的比较:两独立样本t检验这种检验是通过对两个独立样本的平均数的比较,看其来自的两个独立总体的平均数是否有显著性差异。操作过程:Analyze/compare means/Independent sample T test第7页,此课件共27页哦有无差异性的判断:假设检验有无差异性的判断:假设检验假设检验中的假设通常都认为比较双方没有差异性,例如,认为初二(1)和初二(2)班总成绩是一模一样的,然后计算出这种假设出现的可能性,可能性用p来表示。显著显著不显著不显著0.05 不显著不显著p0.05 显著显著*0.01 非常显著非常显著*0.001 极其显著极其显著*拒绝假设拒绝假设接受假设接受假设第8页,此课件共27页哦延伸一研究问题:研究问题:某数学老师对某班级进行了教学方法的改革,已知在改革前,其班学生的数学全市统考标准分标准分为82.1分,改革三个星期后,学生的数学全市统考标准标准分分为86.8分。试问:改革前后学生数学成绩有没有变化?分析:分析:这里同样不能简单地认为改革后学生数学成绩提高了!需要进行 t 检验,但是这里涉及的仅仅是一个班级,因此也就不能用两独立样本 t 检验了,而需要运用配对样本 t 检验。第9页,此课件共27页哦Paired sample T test(配对样本(配对样本T检验)检验)这种检验是通过对两个配对或相关独立样本的平均数的比较,看其来自的两个配对或相关总体平均数是否有显著性差异。操作过程:Analyze/compare means/Paired sample T test第10页,此课件共27页哦延伸二研究问题:研究问题:已知某初中2004-2005学年度第二学期期末考试中,全校数学平均分为74.6分,大市的统考平均分为76分,请问:该校的数学成绩处在大市的什么水平?分析:分析:这个问题涉及到一个样本和一个总体的比较,需要用到进行单样本t检验,这种检验是把一个样本平均数与总体平均数比较,检验其是否有显著性差异。操作过程:操作过程:Analyze/compare means/Single sample T test第11页,此课件共27页哦延伸三:比较对象是两个以上时怎么办?研究问题研究问题:已知三个班的数学期末考试成绩,试问:三个班的成绩有没有差异性?分析:分析:这里所涉及的比较对象超出了两个,因此不能运用t检验,三个及以上对象的差异性比较需要运用F检验(方差分析)。操作过程:操作过程:Analyze/compare means/one-way ANOVA第12页,此课件共27页哦方差分析结果怎么看?F值是不是显著?值是不是显著?显著显著*:p0.05多重事后比较:两两对象比较多重事后比较:两两对象比较1班和班和2班比班比1班和班和3班比班比2班和班和3班比班比显著显著*:p0.05显著显著*:p0.05显著显著*:p0.05三个班三个班级成绩级成绩没有差没有差异性。异性。第13页,此课件共27页哦延伸四:频数差异怎么比较?研究问题研究问题研究问题研究问题1 1 1 1:研究人员随机抽取了50名高三学生为样本,测查他们对于高考改革的态度(赞成或者反对)。作“赞成”回答的有22人,作“反对”回答的有28人。问,在对高考改革的态度上是“赞成”人数和“反对”人数是否平均分配?研究问题研究问题研究问题研究问题2 2 2 2:研究人员随机抽取了170名高三学生为样本,测查他们对于高考改革的态度(赞成或者反对)。发现这批学生中60名女生作“赞成”回答的有18人,作“反对”回答的有42人;而在110名男生中,作“赞成”回答的有22人,作“反对”回答的有88人。问,对待高考改革态度上,有无性别差异性?第14页,此课件共27页哦 检验解决两类问题:一是通过实际调查与观测所得到的一批数据,其次数分布是否服从理论上所假定其次数分布是否服从理论上所假定的某一概率分布的某一概率分布;二是对一批观测数据进行双向多项分类后,检验这两类特征之间是独立无关的还是具有相是独立无关的还是具有相依相从、连带相关。依相从、连带相关。例如性别与对某个问题的态度是否有关系,这里性别是一个因素,可分男女两个类别,态度又是一个因素,可分为赞同、不置可否、反对等多种类别。检验简介检验简介第15页,此课件共27页哦(一)总体分布的假设检验(拟合良度检验)(一)总体分布的假设检验(拟合良度检验)总体分布的假设检验(拟合良度检验)即解决“从实际调查与观测所得到的一批数据,某次数分布是否服从理论上所假定的某一概率分布”的问题。第16页,此课件共27页哦研究实例研究实例研究人员随机抽取了50名高三学生为样本,测查他们对于高考改革的态度(赞成或者反对)。作“赞成”回答的有22人,作“反对”回答的有28人。问,在对高考改革的态度上是“赞成”人数和“反对”人数是否平均分配?操作:操作:Analyze/Nonparametric Test/Chi-square test(卡方检验)。第17页,此课件共27页哦(二)列联表的卡方检验(独立性检验)(二)列联表的卡方检验(独立性检验)以22列联表为例22列联表就是把样本数据同时按两种特征进行双向分类后形成两行两列的四格数据列联表。22列联表下的检验就是利用统计指标来检验特征A和特征B之间是独立无关的还是相依相从连带相关。第18页,此课件共27页哦研究实例研究实例研究人员随机抽取了170名高三学生为样本,测查他们对于高考改革的态度(赞成或者反对)。发现这批学生中60名女生作“赞成”回答的有18人,作“反对”回答的有42人;而在110名男生中,作“赞成”回答的有22人,作“反对”回答的有88人。问,对待高考改革态度上,有无性别差异性?操作:操作:Analyze/descriptive Statistics/Crosstabs。把性别变量送入rows框、把态度变量送入columns框中 第19页,此课件共27页哦小结数值类数值类型型连续性数值连续性数值 两对象两对象(t检验)检验)非连续数值:如次非连续数值:如次数,人数。数,人数。三对象及以上:初二(三对象及以上:初二(1)、()、(2)、()、(3)班比)班比(F检验)检验)单样本:初二(单样本:初二(1)班成)班成绩与大市成绩比绩与大市成绩比两独立样本:初二(两独立样本:初二(1)与初)与初二(二(2)比较)比较配对样本:初二(配对样本:初二(1)班改革前)班改革前成绩与改革后成绩比较成绩与改革后成绩比较分布检验:分布检验:“赞成赞成”与与“反对反对”人数是否相当。人数是否相当。列联表检验:态度有无性别差异性。列联表检验:态度有无性别差异性。第20页,此课件共27页哦怎么判断一个学生成绩的好坏?怎么判断一个学生成绩的好坏?总分100分的卷子,小明考了90分,请问小明考得怎么样?小明政治考了90分,数学考了65分,请问哪一门考得好?小明期中考试物理考了88分,期末考试考了70分,请问小明进步还是退步?注意注意:由于各考试的难易度不同,所以分值的价值就:由于各考试的难易度不同,所以分值的价值就不同,因此不能简单地运用粗分进行比较!这就需要不同,因此不能简单地运用粗分进行比较!这就需要将粗分转化为标准分。将粗分转化为标准分。第21页,此课件共27页哦标准分数标准分数它是一种以平均分数为参考点,以标准差为单位的,表示一个分数在团体中所处位置的量数,常见的标准分数由以下两种:Z分数分数:Z分数会出现负数和小数。Z分数计算在SPSS中的实现:Analyze/descriptive Statistics/descriptive。选中save standardized values as variables.T分数:分数:将原始分数转化为Z分数后,为了使用方便,再进行一次线性变换,即转化为标准T分数,这样既体现了标准分数的优越性又消除了负数和小数。例如广东省的高考分值转化为广东省的高考分值转化为广东省的高考分值转化为广东省的高考分值转化为第22页,此课件共27页哦实例分析实例分析下表是两位高考考生的考试成绩,按传统卷面分数累加的方法决定录取分数应录取乙同学,但考试成绩除受到考生主观因素影响外,还受到难度,区分度等客观因素影响。如果按标准分数求和,录取结果是否一致?哪种方法更科学?第23页,此课件共27页哦结果结果第24页,此课件共27页哦学生数学成绩和物理成绩有没有关系,若有,又是什么关系?学生数学成绩和物理成绩有没有关系,若有,又是什么关系?这种探求两变量之间关系的统计手段被称为相关分析,相关分析是研究变量间关系密切程度的一种统计方法。变量间关系的数量指标通常用相关系数r来表示,其取值范围为-1,+1,表明变量间的密切程度,越接近1表明变量间相关密切程度越高。正负号表明两变量发展变化的方向,如果变化方向一致则为正相关(如身高与体重的关系);变化方向不一致则为负相关(如吸烟与肺功能的关系)。但是要注意相关关系并不是因果关系!但是要注意相关关系并不是因果关系!第25页,此课件共27页哦两种基础的相关两种基础的相关Pearson积差相关(皮尔逊积差相关):积差相关(皮尔逊积差相关):处理连续变量,例如数学成绩和物理成绩的关系。操作过程:Analyze/Correlate/Bivariate,选中Pearson(默认)。Spearman相关(斯皮尔曼等级):相关(斯皮尔曼等级):处理非连续变量,例如求学生学习成绩排名与德育排名的关系。操作过程:Analyze/Correlate/Bivariate,选中Spearman。第26页,此课件共27页哦谢谢!谢谢!第27页,此课件共27页哦