《心理统计样本平均数的分布.ppt》由会员分享,可在线阅读,更多相关《心理统计样本平均数的分布.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理统计样本平均数的分布现在学习的是第1页,共23页一综述一综述上一章:总体中某一特定分数或一组分数出现的概率 本章:总体中特定样本发生的概率。与推论统计关系更密切.深入理解:推论统计的目标?逻辑?现在学习的是第2页,共23页从同一总体取3次不同样本。每一个都不同:不同形状,不同均值,不同方差。如何对总体均值作出最佳估计?现在学习的是第3页,共23页二样本均值的分布二样本均值的分布(distribution of sample mean)所有这些可能的样本会组成一个简单、有序、可预测的所有这些可能的样本会组成一个简单、有序、可预测的模式模式(样本分布样本分布).因此因此,我们可以用样本平均数的
2、分布我们可以用样本平均数的分布(distribution of sample mean)的特征为依据来预)的特征为依据来预测。测。样本平均数的分布样本平均数的分布(distribution of sample mean):总体中可抽取的所有可能的特定容量总体中可抽取的所有可能的特定容量(n)的随机样本的的随机样本的样本平均数的分布。样本平均数的分布。现在学习的是第4页,共23页我们所要做的就是考察所有可能的样本我们所要做的就是考察所有可能的样本(n一定,这点一定,这点很重要;不同很重要;不同n的分布不同的分布不同)然后根据其特性对总然后根据其特性对总体特性(如总体平均数)作出预测。体特性(如总
3、体平均数)作出预测。一个具体例子一个具体例子:考虑下列总体:考虑下列总体:2,4,6,8 这个总体很小,我们知道其平均数这个总体很小,我们知道其平均数(和方差和方差):M=5,但假定我们不知道但假定我们不知道,想根据样本进行估计。想根据样本进行估计。如何作到如何作到?现在学习的是第5页,共23页step 1:选取样本容量。选取样本容量。本例中n=2(每次抽取两个)以后还会讨论样本容量,而一般原则是:样本容量越大,样本间相似的机会越高(样本与总体相似的机会也越高)step 2:考虑所有可能的样本考虑所有可能的样本,并考察其并考察其分布。分布。现在学习的是第6页,共23页_ 分数分数 样本均值样本
4、均值(平均数)(平均数)样本样本 firfirstst secondsecond ()1 1 2 2 2 2 2 2 2 2 2 2 4 4 3 3 3 3 2 2 6 6 4 4 4 4 2 2 8 8 5 5 5 5 4 4 2 2 3 3 6 6 4 4 4 4 4 4 7 7 4 4 6 6 5 5 8 8 4 4 8 8 6 6 9 9 6 6 2 2 4 4 1010 6 6 4 4 5 5 1111 6 6 6 6 6 6 1212 6 6 8 8 7 7 1313 8 8 2 2 5 5 1414 8 8 4 4 6 6 1515 8 8 6 6 7 7 1616 8 8 8
5、8 8 8 现在学习的是第7页,共23页样本均值的分布样本均值的分布 f 2 1 3 2 4 3 5 4 6 3 7 2 8 1 现在学习的是第8页,共23页step 3:现在可以回答这个问题现在可以回答这个问题:选取一个均值大于选取一个均值大于7 p(7)的样本的概率是多少的样本的概率是多少?考察样本均值的分布考察样本均值的分布,我们发现我们发现 16 个样本当中有个样本当中有1个样本其均值大于个样本其均值大于 7。问题:从问题:从2、4、6、8四个数中每次随机抽四个数中每次随机抽2个数作个数作为样本,问样本均数为为样本,问样本均数为4的概率是多少?的概率是多少?这样我们就可以了解样本分布的
6、规律,从而推论总体。这样我们就可以了解样本分布的规律,从而推论总体。现在学习的是第9页,共23页样本分布与总体分布的关系 1.形状形状:当总体分布为正态,方差已知时,样本均值的分布形状一定是正态分布。总体分布不知道,但是方差已知,只要样本容量 n 较大时(30 以上),样本均值的分布近似正态分布。这样可以用正态分布理论理解样本统计量和总体参数的关系。现在学习的是第10页,共23页 2.均值(平均数)均值(平均数):每个样本平均数总是落在总体均值的附近(或上或下),这些样本均值的平均应该等于总体均值(x=)。(2+3+4+5+3+4+5+6+4+5+6+7+5+6+7+8)/16=80/16=5
7、如果在同一总体中选择一组样本,大部分均值应如果在同一总体中选择一组样本,大部分均值应当堆积在总体均值当堆积在总体均值附近附近(如果不是这样,取样一定如果不是这样,取样一定有偏差有偏差)现在学习的是第11页,共23页3.样本平均数的标准差:标准误(standard error of X;SE)SE=x=/n标准误的用途是:告诉我们样本均值对总体均值的估计标准误的用途是:告诉我们样本均值对总体均值的估计是否准确。是否准确。换言之,取样误差是多大换言之,取样误差是多大。标准误(取样误差)的大小取决于:总体的标准差和所标准误(取样误差)的大小取决于:总体的标准差和所取样本容量的大小。理论上讲,样本容量
8、越大,取样取样本容量的大小。理论上讲,样本容量越大,取样误差越小误差越小。(画图举例)(画图举例)现在学习的是第12页,共23页样本均数分布为正态分布前面讲到:(1)当总体分布为正态,方差已知时,样本均值的分布形状一定是正态分布。(2)总体分布不知道,但是方差已知,只要样本容量 n 较大时(30或50以上),样本均值的分布近似正态分布。现在学习的是第13页,共23页样本均数分布为t分布但还有其他情况:(1)总体方差未知时,(2)样本容量较小时(n30),这两种情况下样本平均数分布为t分布。t分布表的使用(类似Z分布)课下阅读185-188页,掌握t分布特点。现在学习的是第14页,共23页样本均
9、数分布为t分布样本平均数分布的标准误 SE=Sx=x=s/n-1 或者 Sx=x=sn-1/n s=x2/n sn-1=x2/n-1 现在学习的是第15页,共23页三、总体参数的估计(不讲)学习样本分布可以对总体参数进行估计:由样本统计量估计总体参数(推论统计)总体参数估计包括点估计和区间估计现在学习的是第16页,共23页点估计:总体参数通常不知道,可以用具体的某个样本统计量估计。由于样本统计量取值为数轴上某一点,故对总体参数的估计为点估计。(1)通常用样本平均数(X),作为总体参数的估计值(理论上希望抽样没有偏差,故样本平均数代表总体平均数)。(2)用样本方差(sn-12)作为总体方差的无偏
10、估计值(即代表总体方差)。现在学习的是第17页,共23页事实上,我们很难说总体参数和某个具体的统计量恰恰一样,也就是说点估计正确的概率是有限的(实际很小)但如果说总体参数落在以样本统计量为核心的某个区间(区值范围)内,则把握大得多,这就是区间估计。区间估计:是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某个置信区间可能的概率。现在学习的是第18页,共23页考虑下列总体分布考虑下列总体分布 假定我们猜测均值是85。这个猜测的置信性如何?假定我们猜测均值是在 71和99之间的某处?这个猜测的置信性如何?也许你觉得后者的置信度较高。这个差异对应于点估计和区间估计间的差别
11、。现在学习的是第19页,共23页 1 x包含所有X 的68.26%1.96 x包含所有X 的95%2.58 x包含所有X 的99%现在学习的是第20页,共23页阅读198-203页例:例:=85,s=5,n=25。请对总体。请对总体平均数作点估计和区间估计平均数作点估计和区间估计 现在学习的是第21页,共23页均值的点估计均值的点估计 如何找到总体均值的最佳单一值估计如何找到总体均值的最佳单一值估计?(1)如果我们可以得到所有可能随机的样本,那么最佳的估计就是样本均值分布的均值。(2)假定我们只有一个样本。最佳的猜测是什么?当然是,样本均值当然是,样本均值。(3)这个猜测是不是最佳的猜测?1)这是我们已知的唯一,最佳的猜测。2)大部分样本均值会相当接近总体均值,所以有很大的机会样本均值会很接近。现在学习的是第22页,共23页(4)如何有更大的机会使估计准确?我们可以用区间估计。=(z)()Z可以为可以为t(这要看分布类型),其大小取(这要看分布类型),其大小取决于想要的置信度(决于想要的置信度(0.99/0.95)记住:尾部为记住:尾部为5%时,时,z分数为分数为1.65;尾部;尾部为为2.5%时,时,z分数为分数为1.96。现在学习的是第23页,共23页
限制150内