数理统计_方差与标准差hatw.docx
《数理统计_方差与标准差hatw.docx》由会员分享,可在线阅读,更多相关《数理统计_方差与标准差hatw.docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理和教育方面的实验或调查所得到的数据,大都具有随机变量的性质。而对这些随机变量的描述,仅有前一章所讲集中趋势的度量是不够的。集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等等。第一节 方差与标准差方差(Variance)也称变异数、均方。作为统计量,常用符号S2表示,作为总体参数,常用符号2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差,在数理统计中又常称之为二阶中心矩或二级动差。
2、它是度量数据分散程度的一个很重要的统计特征数。标准差(Standard deviation)即方差的平方根,常用S或SD表示。若用表示,则是指总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。符号不同,其含义不完全一样,这一点望读者能够给予充分的注意。一、方差与标准差的计算(一)未分组的数据求方差与标准差基本公式是: (3l a) (31b)表31说明公式31a与31b的计算步骤表31 未分组的数据求方差与标准差Xi XiXx x2(XiX)2 Xi2 6 5 7 4 6 8 0 -1 l -2 0 2 0 l 1 4 0 4 36 25 4
3、9 16 36 64 N6 Xi36 x0 x210 Xi2226 应用31公式的具体步骤:先求平均数X36/66;计算Xi -X;求(Xi - X)2即离均差x2;将各离均差的平方求和 (x2);代入公式31a与31b求方差与标准差。具体结果如下: S2=10/6=1.67 (二)已分组的数据求标准差与方差数据分组后,便以次数分布表的形式出现,这时原始数据不见了,若计算方差与标准差可用下式: (33a) (33b)式中d(Xc - AM) / i,AM为估计平均数Xc为各分组区间的组中值f为各组区间的次数N=f 为总次数或各组次数和i为组距。下面以表18数据为例,说明分组数据求方差与标准差的
4、步骤:表32 次数分布表求方差与标准差 分组区间 Xc f d fd fd2 计 算 96- 93- 90- 87- 84- 81- 78- 75- 72- 69- 66- 63- 60- 97 94 91 88 85 82 79 76 73 70 67 64 61 2 3 4 8 11 17 19 14 10 7 3 l 1 6 5 4 3 2 1 0 1 2 3 4 5 6 12 15 16 24 22 17 0 14 20 21 12 5 6 72 75 64 72 44 17 0 14 40 63 48 25 36 S2=32* (570/100 -(28/100)2)=50.5944
5、 S7113 i=3 f100 fd=28 fd2=570 具体步骤: 设估计平均数AM,任选一区间的Xc充任; 求d 用f乘d,并计算fd; 用d与fd相乘得fd2,并求fd2; 代入公式计算。二、方差与标准差的意义 方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。它基本具备一个良好的差异量数应具备的条件:反应灵敏,每个数据取值的变化,方差或标准差都随之变化;有一定的计算公式严密确定;容易计算;适合代数运算;受抽样变动的影响小,即不同样本的标准差或方差比较稳定;简单明了,这一点与其他差异量数比较稍有
6、不足,但其意义还是较明白的。除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。对于任何一个数据集合,至少有1一1/h2的数据落在平均数的h(大于1的实数)个标准差之内。(切比雪夫定理)。例如某组数据的平均数为50,标准差是
7、5,则至少有75(1一1/22)的数据落在50-2*5至50+2*5即40至60之间,至少有889(1一1/32)的数据落在50-3*5至50+3*53565之间 (h=2,1-1/h2=1-1/22=3/4=75%,h=3, -1/h2=1-1/32=8/9=88.9%)。如果数据是呈正态分布,则数据将以更大的百分数落在平均数上下两个标准差之内(95)或三个标准差之内 (99.)。三、由各小组的标准差求总标准差 由于方差具有可加性特点,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。这种计算常在科研协作中应用,例如先了解各班学生情况,再了解全年级情况;或
8、先了解各年级情况,再了解全校总的情况。但这种方差或标准差的合成,只有在应用同一种观测手段,测量的是同一个特质,只是样本不同时,才能应用。计算总方差或总标准差的公式如下; (34a) (34b) 式中 为总方差 为总标准差 N1Nn为各小组数据个数 为总平均数 为各小组的平均数四、标准差的应用 (一)差异系数(Coefficient of variation)当所观测的样本水平比较接近,而且是对同一个特质使用同一种测量工具进行测量时,要比较不同样本之间离散程度的大小,一般可直接比较标准差或方差的大小-标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。标准差的单位与原数据的单位相同
9、,因而有时称它为绝对差异量。在对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:两个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?即使使用的是同+种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?在第一种情况下,标准差的单位不同,显然不能直接比较标准差的大小。第二种情况虽然标准差的单位相同,但两样本的水平不同,这可从平均数的大小明显不同确定。通常情况下,平均数的值较大,其标准差的值一般也较大,平均数的值较小,其标准差的值也较小。这种情况下,若直接比较标准差取值的大小,借以比较不同样本的分散情况是无意义的。可见,上述两种情况下,若用绝对差异量进行直接比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 方差 标准差 hatw
限制150内