教育统计学笔记公式(共4页).doc
《教育统计学笔记公式(共4页).doc》由会员分享,可在线阅读,更多相关《教育统计学笔记公式(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。统计学和教育统计学的内容:从具体应用角度来分,可以分成:描述统计、推断和实验设计三部分。描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法。通过教育调查和教育实验获得了大量的数据,用归组、编表、绘图等统计方法对这进行归纳、整理,以直观形象的形式反映其分布特征;通过计算各种特征量,来反映它们分布上的数字特征。推断统计:根据样本所提供的信息,运用概率的
2、理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。描述统计是推断统计的基础,推断统计是通过样本信息估计、推测总体,从已知情况估计、推测未知情况。学习统计学和教育统计的学的意义:一、统计学为科学研究提供了一种科学方法,统计推理的方法是归纳法。二、教育统计学是教育科研定量分析的重要工具。三、广大教育工作者学习教育统计学的具体意义:1、可以顺利地阅读运用统计方法进行定量分析的科研报告。2、可以提高教育工作的科学性和效率。3、为学习教育测量及教育评价打下基础。随机现象:1、一次试验有多种可能结果,其所有可能 结果是已知的;2、试验之前不能预料哪一种可能结果会出现;3、在相同的条件下可以
3、重复试验。随机现象的每一种结果叫做一个随机事件。总体:研究的具有某种共同特性的个体的总和。总体中的每个单位称为个体。样本是从总体中抽取的作为观察对象的一部分个体。样本上的数字特征是统计量。总体上的各种数字特征是参数。在进行统计推断时,就是根据样本统计量来推断总体相应的参数。第二章数据的初步整理教育统计资料的来源:经常性资料、专题性资料(教育调查、教育实验)数据的种类:按来源分:点计数据和度量数据,按随机变量取值情况分:间断型(取值个数有限的数据,一般为整数)和连续型随机变量(取值个数无限的不可数的数据可用小数表示)。数据的统计分类:按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分析
4、时所用统计方法的可能性,将所获得的数据进行分组归类。分类标志按形式划分:性质类别和数量类别。统计表:一般由标题、表号、标目、线条、数字、表注构成。分复合表、简单表、分组表。某一个随机事件在次试验中出现的次数称为随机事件的频数。简单频数分布表:求全距、决定组数和组距、决定组限、登记频数。统计图:表示间断变量的统计图:直条图、圆形图。表示连续变量的统计图:线形图、频数分布图(直方图、多边图、累积频数和累积百分比多边图)第三章集中量:是代表一组数据典型水平或集中趋势的量。算术平均数:算术平均数是所有观察值的总和除以总频数所得之商,它是统计学中最易理解最常应用的一种集中量指标。特性:观察值的总和等于算
5、术平均数的倍,各观察值与其算术平均数之差的总和等于0,若一组观察值是由两部分或几部分组成,这组观察值的算术平均数可以由组成部分的算术平均数而求得。优缺点:1、反应灵敏。2、严密确定3、简明易懂,计算简单4、适合代数运算5、只知一组观察值的总和及总频数就可以求出算术平均数。6、用加权法可以求出几个平均数的总平均数。7、用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。8、在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。缺点是:易受两极端数值的影响。一组数据中某个数值大小模糊不清或不够确切时,就无法计算。它所适用 的条件:一组数据中每个数据都比
6、较准确可靠;无两极端数值影响;而且还要通过它计算其他统计量。中位数是位于依一定大小顺序的一组数据中央位置的数值。各有一半数的一级数据的数据个数一分为二的数值。是百分位数的一种。百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。中位数的应用及其优缺点:不适合代数计算,与算术平均数相比抽样偏差相对较大。很少受两极端数值的影响,由数据的个数所决定,反应不灵敏,适用于:1、一组数据有特大或特小两极端数值时2、一组数据中有个别数据不确切、不清楚时。3、资料属于等级性质时。第 节众数皮尔逊经验法:。众数的应用及其优缺点:随频数分布表上的组距变化而变化,极不准确、极不稳定。不适合代数计算,受抽样变
7、动较大,较少受两极端数值的影响,反应不灵敏。使用条件:1、当需要快速而又粗略地找出一组数据的代表值时2、当需要利用 算术平均数、中位数、众数三者关系来粗略地判断频数分布的形态时3、利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。当一个频数分布出现两个频数最多一组时,可以通过合并组距的方法视其资料的同质性。若合并后仍有两个集中点,则表明这组数据是由两种性质不同资料混合在一起。算术平均数、中位数、众数三者关系:当频数分布呈正态时,三者合为一点:;当频数分布呈正偏态时,负偏态时:加权平均数 几何平均数 调和平均数加权平均数是不同比重数据或平均的平均数。几何平均数:n个数值连乘积的
8、n次方根。当一个数列的后一个数据是以前一个数据为基础成比率增长时,要用它求其平均增长率,常用作速率的集中量,在教育方面,求增加率、进步率等。求法是n个数据连乘积的n次方根。调和平均数:是一组数据倒数的算术平均数的倒数。主要是用来求学习速度。第 章差异量表示一组数据变异程度或离散程度的量叫差异量。差异量大大,表示数据分布越广,越不整齐、差异量越小,表示数据分布得越集中,变动范围越小,(全距、四分位距、百分位距、平均差、方差、标准差、)绝对差异量,(差异系数。)相对差异量全距是一组数据中最大值与最小值之差。四分位距是用依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标。四分位距的
9、应用及其优缺点:简明易懂,计算简便,较少受两极端数值的影响,比全距可靠的多。但它忽略了左右共50%数据的差异,不适合代数运算。当一组数据中用中位数表示集中量时,就要用四分位距表示差异量。第 节平均差每一个数据与该组数据的中位数或算术平均数离差的绝对值的算术平均数。第 节方差和标准差方差是指离差平方的算术平均数,一组数据中每个数据与该组平均数之差,平方之求其和,再除以数据的个数。标准差即方差的平方根优点:反应灵敏,随任何一个数据的变化而变化,严密确定,一组数据的方差及标准差有确定的值,计算简单,适合代数运算,可以将几个方差和标准差综合成一个总的方差和标准差,用样本数据推断总体差异量时,方差和标准
10、差是最好的估计量。在避免两极端数值影响方面超过全距,在考虑到全部离差方面,优于四分位距,在避免绝对值方面优于平均差。缺点是不太容易理解,易受两极端的影响,有个别数值糊涂不清时无法计算。最直接的用途是描述一组数据的离散程度。第 节相对差异量对两种单位不同或单位相同而两个平均数相差较大的资料进行差异大小的比较。偏态量及峰态量:,时,分布呈对称形,正偏态负偏态。偏态系数:峰态量时呈正态峰,高狭峰 低阔峰第五章概率及概率分布以随机事件在大重复试验中出现的稳定频率值作为随机事件概率的估计值,这样寻得的概率称为后验概率。先验概率是在特定条件下直接计算出来的,是随机事件的真实概率,不是由频率估计出来的。概率
11、的性质:任何随机事件的概率都是在0与1之间不可能事件的概率等于0,必然事件的概率等于1第 节二项分布凡满足以下条件的试验称为二项试验:一次试验只有两种可能结果,即成功和失败,各次试验相互独立,即各次试验之间互不影响。各次试验中成功的概率相等,各次试验中失败的概率也相等。二项分布是一种离散型随机变量的概率分布。二项分布函数:二项分布的平均数和标准差:当二项分布接近正态分布时,在n次二项试验中成功事件出现次数的平均数为标准差为,二项分布的应用:除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。正态分布是一种连续型随机变量概率分布。正态曲线的函数:正态曲线
12、的特点:曲线在Z()处为最高点。曲线以Z处为中心双侧对称。曲线最高点向左右缓慢下降,并无限伸延,但永不与基线相交。标准正态分布上的平均数为标准差为,基线上Z从至+,个标准差距离间几乎包含了全部(.73%)面积,曲线从最高点向左右延伸时,在正负个标准差之内既向下又向内弯,正负个标准差开始,既向下又向外弯。正态曲线在测验记分方面的应用:1、将原始分数转换成标准分数。标准分数的优点:各科标准分数的单位是绝对等价的;标准分数的数值大小和正负,可以反映某一考分在团体中所处的位置;确定录取分数线;确定等级人数;品质评定数量化。第章抽样分布及总体平均数推断平均数抽样分布的几个定理:1、从总体中随机抽出容量为
13、n的一切可能样本的平均数之平均数等于总体平均数2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。3、从服从正态分布的总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。4、虽然总体不呈正态分布,如果样本容量较大,反映总体和的样本平均数的抽样分布也接近于正态分布。当总体标准差为已知时,平均数抽样分布的标准差与样本容量n的平方根成反比,即样本容量越大,平均数抽样分布的标准差越小,当样本容量n确定时,平均数抽样分布标准差与总体标准差成正比,即总体数值离差程度越大,平均数抽样分布的标准差越大。抽样分布是统计推断的理论依据。某种统计量在抽样分布上的标准差称为该种统计量
14、的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所以标准误是统计推断可靠性的指标。样本平均数与总体平均数离差统计量的形态:分布与正态分布的相似之处:分布基线上的值从-+;从平均数等于处,左侧值为正;曲线以平均数处为最高向两侧逐渐下降,尾部无限伸延,永不与基线相接,呈单峰对称形。区别之处在于:分布形态随自由度的变化呈一簇分布形态,分布的峰镲尖峭,尾长而翘得高,在基线上分布的范围广,自由度越小,分布范围越广。当自由度逐渐增大时,分布逐渐接近正态分布。当自由度趋于无限大时,分布与正态分布重合。第 节总体平均数的估计根据样本信息对总
15、体参数的有两种不同形式:总体参数估计和假设检验。总体参数估计的基本原理:根据样本统计量对相应总体参数所作的估计叫总体参数估计,分为点估计(无偏性、有效性、一致性)和区间估计。当用某一样本统计量的值来估计相应总体参数的值叫点估计。以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围。区间估计:第节假设检验的基本原理利用样本信息,根据一定概率,对总体参数或分布的某一假设作出气绝或保留的决断,称为假设检验。零假设是关于当前样本所属的总体与假设总体无区别的假设。备择假设是与零假设相反的假设,是研究者根据样本信息期待证实的假设,是根据样本信息否定了零假设
16、时,应当采取的假设。统计推理采用的是反证法。小概率事件:样本统计量的值(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平。显著性水平:统计学中把拒绝零假设的概率。显著性水平越高,越不容易拒绝零假设,推断的可能性就越大。统计决断的两类错误及其控制:第一类错误:假设真实而被拒绝,第二类错误:假设属伪而被保留。第一类错误的控制通过选择适当的显著性水平加以主动控制。后果非常严重的用较高的显著性水平,0.010.005,当拒绝一个属真的假设其后果不是严重的,选用较低的显著性水平0.050.1。控制第二类错误的概率的方法:利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置。
17、2、使样本容量增大。总体平均数的显著性检验右侧检验 第 章平均数差异的显著性检验本章是根据两个样本平均数之差检验两个相应总体平均数之差的显著性。根据两个样本统计量的差异检验两个相应总体参数差异的显著性,统计学上称为差异显著性检验。相关样本平均数差异的显著性检验:两个样本内个体之间存在着一一对应关系,这两个样本称为相关样本,分为两种情况:配对组和对照组。小样本大样本:用Z检验,公式同上。独立样本平均数差异的显著性检验:大样本:独立小样本:独立小样本方差不齐性时差异显著性检验:方差齐性检验:对两个总体的方差是否有显著性差异所进行的检验。两个独立样本的方差齐性检验:两个相关样本的方差齐性检验:第八章
18、方差分析基本原理:方差分析的目的:平均数差异的显著性检验,是对两个平均数的比较,在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。方差分析的功能就在于对多组平均数差异的显著性进行检验方差分析中的几个概念:实验中的自变量称为因素。只有一个自变量的实验称为单因素实验。有两个或两个以上自变量的实验称为多因素实验。某一个因素的不同情况称为因素的水平,包括量差或质别两类情况,按各个水平条件进行的重复实验称为各种处理。假如要研究两种教材及三种教学法对学生学习成绩的影响,该实验是双因素的实验。一个因素是教材,它有两种水平,另一个因素是教学方法,它有三种水平。这个实验称为2*3的实验设计
19、,共有6种处理,若一个实验为2*2*2设计,则表示该实验有三个因素,每个因素有两种水平,共有8种处理。用方差分析法检验某一因素对因变量的作用,称为单因素方差分析。完全随机设计的方差分析:为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。相等的情况:组间平方和: 组内平方和: 总平方和:组间自由度:组内自由度: 总自由度:不相等 组间平方和: 组内平方和: 总平方和: 用进行组间与组内方差的F检验对多组平均数每对之间的差异进行多重比较的方
20、法,检验法最为常用。各组n相等:各组n不相等:第节随机区组的设计的方差分析在检验某一因素多种不同水平(即不同实验处理)之间差异的显著性时,为了减少被试间个别差异对结果的影响,把从同一个总体中抽取的被试按条件相同的原则分成各个组(称区组),使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。每一区组内被试的人数分配有以下三种方式:一个被试作为一个区组,所有的被试都要分别接受各种实验处理。每一区组内的被试的人数是实验处理数的整数倍数。区组内不是以个别被试为基本单元,而是以一个团体为一个基本单元。完全
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计学 笔记 公式
限制150内