应用统计学基础复习.pdf
统计学 BASIC -1-第一章 绪论 第一节 研究对象 1 统计学 1.1 统计学分为数理统计与应用统计,1.2 应用统计分为心理统计、生物统计、医学统计、社会统计、经济统计等等 1.3 心理统计分为描述统计、推论统计、研究设计。2.推论统计 2.1 推论统计常用于从局部数据估计总体情况。例:6 岁儿童的男女身高差异问题的研究。从某地区随机抽取男生 30 人,平均身高为 114cm;女生 27 名,平均身高为 112.5cm。能否根据这一次测量的结果下结论:6 岁男生的身高比女生高?2.2 心理与教育类实证研究的结果,基本上都不能直接得出结论,而需要运用推论统计。第二节 为什么要学习统计学 一、发现随机现象的运动规律 二、贯穿整个心理学研究过程的方法与技术 三、心理学研究资料分析的技术 四、“行话”方便交流、阅读与撰写 五、心理学专业的应用技术之一 第三节 基础概念 一、总体、样本和个案 例:关于汽车限行制度,想了解 A 城市民对此事件的态度 调查对象:所有 A 城市民 调查目的:赞成 vs.反对,各自的比例 可以去问所有的 A 城市民吗?不可能,只能问其中一部分,并根据该部分的观点来了解永川市民的总体观点 二、统计量(特征量)和参数(一)总体的特性称为参数,用希腊字母表示;样本的特性称为统计量,用英文字母表示(二)统计量(特征量)和参数 三、数据(变量)的类型(1)根据数据反映的测量水平,可分为:“称名”,特点:起名称作用,不同的数字没有大小之分(不可比较),不能加减乘除。“顺序”,特点:可比较,不能加减乘除。“等距”,特点:可比较、可加减,不能乘除。“比率”,特点:可比较、可加减乘除。四种类型变量的数学关系比较 数据类型 数学关系 =or or 公务员 教师 工人”3.直方图,主要用于表示()数据资料 4.直条图,主要用于表示()数据资料 5.要表明各个部分在总体中所占的比重(百分比),通常用()图?6.什么是离差?7.一组数据的离差和等于多少?负偏态和正偏态 均数中位数众数 众数中位数均数 统计学 BASIC -6-?练习:一位教师计算了全班 60 个同学考试成绩的均值,中数和众数,发现大部分同学的考试成绩集中于高分段。下面说法不可能正确的是?A.全班 65%的同学的考试成绩高于均值 B.全班 65%的同学的考试成绩高于中数 C.全班同学的考试成绩是负偏态分布(三)四分(位)差 i.又称四分位距,常用 Q 表示。ii.剔除掉整组观测值中最高的 1/4 和最低的 1/4 的数据,然后计算中间的一半数据的全距,再除以 2 而得到。Q2 正好是中位数 Q1,Q2 和 Q3 分别被称为 第一、第二和第三四分位数。练习:计算过程:二、方差与标准差(一)定义 A.方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用表示,总体的方差用表示。B.标准差(standard deviation)是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差用表示。C.标准差和方差是描述数据离散程度的最常用的差异量。统计学 BASIC -7-?练习:?练习:试估计 49、50、51 的均数和标准差。(三)标准差的性质 标准差的性质 1:每个观测值都加一个相同的常数 C 后,计算得到的标准差等于原标准差 标准差的性质 2:每个观测值都乘以一个相同的常数 C 后,计算得到的标准差等于原标准差乘以这个常数 标准差的性质 3:每一个观测值都乘以一个相同的常数 C(C0),再加上一个常数 d所得的标准差等于原标准差乘以一个常数?练习:已知一组数据 6,5,7,4,6,8 的标准差是 1.29,把这组数中的每一个数据都加上 5,再乘以 2,得到的新数据组的标准差是()。A 1.29 B 6.29 C 2.58 D 12.58(四)方差与标准差的意义 标准差度量的是观测值与平均数间的平均距离。S=0 代表观测值完全没有散布(全都在同一点),否则必然有 S 0。当观测值离平均数散布得越远,S 就越大。比较:平均数与标准差的性质 统计学 BASIC -8-?练习 1.由于记分错误,在一个心理课程的期末考试中每一个考试分数都被加上了 10 分。这个错误对于平均数和标准差分别有什么影响?2.计算下面数列的标准差:1)20,1,2,5,4,4,4,0 2)5,5,5,5,5,5,5,5,5,5(五)标准差的应用 典例:一个班级男生身高的平均数是 1.75 米,标准差是 0.10 米;体重的平均数是 60 千克,体重的标准差是 5 千克,问身高和体重哪个差异大?答:单位不同,不能比较 典例:同样是跳远,大学生的平均成绩是 4 米,标准差为 0.3 米;一年级学生的平均成绩是1 米,标准差为 0.3 米,这两个差异是一样大小吗?答:显然也不是,因为大学生成绩的相对差异比较小,而小学生成绩的相对差异比较大。1.差异系数(1)当两组或几组数据资料单位不同时,不能直接用标准差来比较离散程度的大小;(2)当两组或几组数据资料单位相同时,但它们的平均数相差较大时,也不能直接根据标准差来比较它们的离散程度;应用:(1)比较测量单位不同事物的差异程度;一个班级男生身高的平均数是 1.75 米,标准差是 0.10 米;体重的平均数是 60 千克,体重的标准差事千克问身高和体重哪个差异大?(2)比较单位相同,均数悬殊者 例:初三甲乙两班的数学平均成绩分别为 92 和 71,标准差分别为 8.95 和 7.40。试问两班成绩谁的差异程度大一些?第四节 地位量数 百分位数 百分等级数 Q2 正好是中位数 Q1,Q2 和 Q3 分别被称为第一、第二和第三四分位数。如果将数据分为 100 段,Q1,Q2 和 Q3 分别被称为第 25、第 50 和第 75 百分位数。统计学 BASIC -9-一、百分位(分)数 定义:团体分数高低排序,计算某个百分位数位置所对应的数值(观测值)。表示在该次数分布中,有 20的个案低于 60 60 就是该组数据的第 20 个百分位数 表示在该次数分布中,有 75的个案低于 25 表示在该次数分布中,有 30的个案低于 55?练习:李芳数学成绩班上排名 15,你能对此成绩进行评价吗?为什么?李芳数学成绩 45 分,你能对此成绩进行评价吗?为什么?二、百分等级(分)数 定义:是百分位数的逆运算。符号:例:小张某次考试成绩为 85 分,且 PR=90 含义是:此次考试有 90%的人的成绩低于 85 分 或 此次考试中有 10%的人成绩高于小张?练习:设某次考试人数为 10 000 名,其中有 6895 人的成绩低于 80 分,请确定卷面 80 分这个成绩的百分等级。卷面 80 分是一个什么地位量数,怎么读?含义是什么?引子:概率 Probability 例:.你买彩票中 500 万的机会 很小(接近 0),但有人中大奖的概率 几乎为 1 .你被流星击中的概率 很小(接近 0),但每分钟有流星击中地球的概率为 1 .今天你被汽车撞上的概率 几乎是 0,但在地球每天发生车祸的概率是 1 第三章 随机事件与概率分布 背景知识 心理学研究要分析的数据具有不确定性 只能在一定程度上用样本统计量去估计总体参数,并对这种估计的把握度进行分析说明 把握度:用概率指出做出某种推断,其正确或犯错误的百分比 第一节 随机事件 一、随机现象和随机事件(一)随机现象 1.什么是随机现象 2.随机现象的特点:偶然性、规律性 偶然性 VS.规律性死亡的概率 我们能预测特定的人明年会死亡吗?如果我们观察好几百万人呢?据美国国家卫生统计中心,20-24岁的男性当中,在任一年中死亡的比例大约是0.0015。同年龄层的女性,死亡概率大约是 0.0005。(正因为男性理赔的比例要高一些,所以保险费会收得多一点)统计学 BASIC -10-(二)随机事件(Random events)例:请判断下列事件是属于事件之和 or 事件之积:共 8 个题目,6 个选择,2 个判断,随机从中抽出一个题.从中抽出选择题或判断题是属于事件之(和).计算从中抽出选择题或判断题的概率是属于(互不相容)事件?练习:请判断下列事件是否属于独立事件.抛一枚硬币然后再掷一个骰子(独立).起床太晚和准时上课(非独立).认真学习和拿奖学金(非独立)?练习:1.判断题:被闪电击中的概率大于在一次彩票中 500 万的概率。2.Person 相关系数是用哪个人的名字命名的 A.Karl Marx B.Carl Friedrich C.Karl Person D.Mario Triola?练习:如果一个人随机猜测这两个答案 同时猜对两题,是属于事件之()计算同时猜对两题的概率,是属于()事件 例:假设从 2223 名登上泰坦尼克号的乘客中随机选出 1 人,思考下列问题:计算 P(选出一个 man 或一个 boy),是属于事件之(),是属于()事件 提示:计算 P:(169264)/22231756/2223?练习:.将一枚硬币抛三次,得到的全部是国徽的概率是多少?.如果从一组包含 10 名男性和 15 名女性的组中没有放回地随机选出 3 个不同的人,则选出 3 名男性的概率是多少?(提示:10/25 *9/24 *8/23)二、随机事件的概率 对随机事件的观测或试验可能有多种结果?不仅想知道有哪些可能的结果,还想知某些结果出现的可能性的大小。这一可能性用数字来表示就是概率概率(一)频率与概率 a)频率是大量试验的结果,随试验次数变化的值 b)概率是一个确定值 c)试验次数越多,频率将无限接近于概率 统计学 BASIC -11-d)频率是事件发生的外在表现,概率体现事件发生的内在实质。频率与概率间的关系:A.样本频率总是围绕概率上下波动 B.样本含量 n 越大,波动幅度越小,频率越接近概率。?练习:下面这些值中,不是概率的有那些?0,1,-1,2,0.0123,3/5,5/3 说明:随机变量 例:每次抛两个硬币,记录正、反面结果;结果可记录为:硬币 1 正面朝上,硬币 2 正面朝上;2 个正面 硬币 1 正面朝上,硬币 2 反面朝上;1 个正面 硬币 1 反面朝上,硬币 2 正面朝上;1 个正面 硬币 1 反面朝上,硬币 2 反面朝上;0 个正面 正面出现的次数就是一个随机变量,记为 x,我们通常对 x 的每个取值的概率感兴趣。对于本例,x 的取值为 0、1、2。说明:离散型随机变量与连续型随机变量.离散型随机变量离散型随机变量:数据间有缝隙,其取值可以列举。例如:抛硬币 10 次,正面的可能取值 x 为 0、1、2、3、4、5、6、7、8、9、10 .连续型随机变量连续型随机变量(continous random variable)数据间无缝隙,其取值充满整个区间,无法一一列举每一可能值。例如:身高、体重、百分制考试成绩 三、概率分布(probability distribution)概率分布:描述随机变量值及这些值对应概率的表格、公式或图形。离散型随机变量离散型随机变量概率分布 连续型随机变量连续型随机变量概率分布 例:离散型随机变量的概率分布:例:离散型随机变量的概率分布:连续型随机变量的概率分布 变量的取值充满整个数值区间,无法一一列出其每一个可能值。一般将连续型随机变量整理成频数表频数表,对频数作直方图直方图,直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。统计学 BASIC -12-如果样本量很大,组段很多,矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。大多数情况下,可采用一个函数拟合这一光滑曲线。引子:常用的概率分布 离散型随机变量分布:二项分布、泊松分布 连续型随机变量分布:正态分布 第二节(一)二项分布 毒性试验:白鼠 死亡生存 临床试验:病人 治愈未愈 回答题目:判断题 答对答错 事件事件 成功(成功(A)失败(非失败(非 A)这类“成功失败型”试验称为 Bernoulli 试验 例:一位心理学家想了解儿童对于某种材料的再认能力。设计了 10 个记忆项目,先让儿童识记,然后进行再认测验。结果儿童能正确再认 5 个项目。请判断:该儿童对这种材料究竟有没有再认能力。答:10 个项目认对了 50,完全可能是瞎猜的结果。可以认为该儿童对于这种材料完全没有什么再认能力。思考:认对多少个项目才算有再认能力呢?6 个?7 个?作为研究者,不能凭感觉说话。要研究类似上述问题有没有数量规律性,以便找出一个数字标准:超过这个标准,就认为有再认能力,未达到这个标准,就认为没有再认能力。(二)二项试验 必须满足以下条件:这个过程包括一个固定次数固定次数的试验。每次试验的所有结果都可以分为两类两类;各次试验相互独立独立(即任何一次单独试验的结果都不影响其他试验中结果的概率);各次试验中概率必须是常数(即成功成功的概率恒定恒定,失败失败的概率也恒定恒定)。例:114 查号台声称,当用户查询电话号码时,90的情况下会得到正确的电话号码。假设回答的正确率为 90,假如我们想在 5 次查询中有 3 次回答正确的概率。(1)这个过程是一个二项分布吗?统计学 BASIC -13-(2)如果这个过程的结果是一个二项分布,请说明 n,x,p 和 q 的值。解答:试验次数 5 是固定的;5 次试验是独立的,使用的是不同的电话号码,接线员也不同;5 次试验中的每个试验都有两类结果:要么对,要么错;5 次试验中的每个试验,概率 0.9(90)是常数。例:假设每年 9 月份的降水概率为 0.4。假设 30 天的降水次数为 X,20 年中 9 月份降水的分布即为一个二项分布。p=0.4,q=0.6,n=30;X 取值0,30 如果 20 年的 X 值分别为:15,18,11,12,11,16,14,12,10,12,13,14,13,14,12,8,9,10,12,13 降水次数 时间(三)二项分布函数 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X0,1)的概率分布,叫做二项分布函数。1.二项式概率分布函数:二项式概率分布函数:2.二项展开式的要点:项数:二项展开式中共有 n1 项。方次:p 的方次,从 n0 为降幂;q 的方次从 0n 为升幂。每项 p 与 q 方次之和等于 n。系数:各项系数是成功事件次数的组合数。例:2 道是非题的情况 3 道是非题的情况 统计学 BASIC -14-4 道是非题的情况 例:从男生占/的学校中随机抽取个学生,问正好抽到个男生的概率是多少?最多抽到个男生的概率是多少?解:将 n=6,p=2/5,q=3/5,X=4 代入公式,则恰好抽到 4 个男生的概率为 例:最多抽到个男生的概率,等于个也没有抽到、抽到个和抽到两个男生的概率之和,即 3.二项分布曲二项分布曲线线 形成:以成功次数为 X,组合数为 Y 绘制的多边图。特点(二项分布的性质):当时,不论 n 有多大,二项分布曲线都总是对称的;当时,且 n 相当小,图形呈偏态;当相当大(30)时,图形逐渐接近正态分布。4.二项分布的应用二项分布的应用(1)求成功事件恰好出现 X 次的概率(2)在教育与心理中主要用来判断试验结果的机遇性与真实性的界限。5.二项分布的平均数和标准差二项分布的平均数和标准差 如果二项分布满足 pq 且 nq5(或者 pq 且 np5 时),二项分布接近于 正态分布。(应用前提)可用下面的方法计算:可用下面的方法计算:统计学 BASIC -15-注意注意应应用前提:用前提:应用应用猜测性:猜测性:某测验中有 10 道判断题,试分析学生的掌握情况或猜测的可能性。条件分析:求均数和标准差:确定一定可信度时的掌握程度:结果解释 例:某测验有 30 个正误题,试问学生要做对多少题,才属掌握了所学的内容。例:一个教师对 8 个学生的作业成绩进行猜测,如果教师猜对的可能性为 13,问:假如规定猜对 95,才算这个教师有一定的评判能力,那么这个教师至少要猜对几个学生?统计学 BASIC -16-例:假设把一个质地均匀的硬币抛 3 次,这时你和朋友打赌:着地时出现“正面”会有 2次,赌注为 10 元。如果这种结果出现了,你的朋友必须给你 10 元钱。谁更有可能赢呢?例:有 20 道四择一题,试问学生要做对多少题,才属掌握了所学的内容。统计学 BASIC -17-思考:观察我们的生活,看看哪些现象是服从二项分布规律的?6.二项试验二项试验 必须满足的条件有:a)这个过程包括一个固定次数的试验;b)每次试验的所有结果都可以分为两类;c)各次试验相互独立(即任何一次单独试验的结果都不影响其他试验中结果的概率);d)各次试验中概率必须是常数(即成功的概率恒定,失败的概率也恒定)。7.二项二项(式概率式概率)分布函数:分布函数:例:从男生占/的学校中随机抽取个学生,问正好抽到个男生的概率是多少?最多抽到个男生的概率是多少?解:将 n=6,p=2/5,q=3/5,X=4 代入公式,则恰好抽到 4 个男生的概率为 最多抽到个男生的概率:等于个也没有抽到、抽到个和抽到两个男生的概率之和 例:一块均匀的硬币,A 为正面朝上,B 为反面朝上。假设 n=2(抛两次),有多少可能的结果?两次正面朝上的 p?抛不到正面朝上的 p?只有一次正面的 p?至少一次正面的 p?统计学 BASIC -18-什么条件下,二项分布可以近似为正态分布?n 足够大的时候足够大的时候 8.二项分布曲线二项分布曲线 形成:以成功次数为 X,组合数为 Y 绘制的多边图。特点(二项分布的性质):当时,不论 n 有多大,二项分布曲线都总是对称的;当时,且 n 相当小,图形呈偏态;当相当大(30)时,图形逐渐接近正态分布。9.二项分布的应用二项分布的应用(1)求成功事件恰好出现 X 次的概率?(2)在教育与心理中主要用来判断试验结果的机遇性与真实性的界限。第三节 正态分布(Normal D.)一、正态分布的特征 二、标准正态分布表 利用积分公式可求出正态曲线下任何区间的面积,但需要计算,非常麻烦。统计学家已编制好了标准正态分布表,使其使用非常方便。(见教材后的附表)1.正态分布表的使用:ZP,PZ,PY 或或 ZY ZP 求某个 Z 值以上或以下的面积 -1.22.4 p=0.87673 0.61.5 p=0.20744 求某个 Z 值以上或以下的面积 Z=2.4 以上 P p=0.0082 Z=-1.2 以下 P p=0.1151 PZ 查表法:近似结果 P=0.80,Z=?p=.29955,Z=.84 p=.30234,Z=.85 PY 查表法:P=0.80,Y=?P=.29955,Y=.28034 P=.30234,Y=.27798 PR与 Z 的关系 例:在一正态分布中,若某人的标准分数为 1,则他在该团体中的百分等级应当为 a.34 b.68 c.84 d.75 统计学 BASIC -19-三、标准分数 标准分数(standard score)又称基分数或分数(Zscore)是相对位置量数。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。计算公式:(1)标准分数的实质:把单位不等距和缺乏明确参照点的分数转换成以标准差为单位,以均数为参照点的量表分数。(2)标准分数的优点:可比性:标准分数以团体的平均数为基准(参照点),以标准差为单位,因而具有可比性。可加性:标准分数使不同的原始分数具有相同的参照点。明确性:标准分数较原始分数的意义更为明确。合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实。(3)标准分数的应用:a)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。(比较测量单位不同的变量的位置)b)计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。c)表示测验分数?练习:小学生 A 和 B 在毕业考试中,语文和数学两科的总分均为 184。能否以此说明两人的学习水平相同?为什么?d)比较单位不同变量的比较单位不同变量的位置位置 例:例:已知该班的成绩情况如下表 例:某高考中两生各科成绩如下表。统计学 BASIC -20-异常值的取舍:异常值的取舍:在一个正态分布中,平均数上下一定的标准差处,包含有确定百分数的数据个数。在平均数上下各三个标准差的范围内,分布着全部数据的 99.73%,反言之,在三个标准差之外的数据不足 0.27%,因此常把“三个标准差”做为判断可疑值取舍的依据。四、正态分布表及其应用:韦氏智商分数:选拔性测验:3在能力分组或等级评定时确定人数 4测验分数的正态化 例例:假设对 100 名报考大学的学生进行分班考试,要按能力将这些学生分为 A、B、C、D、E 五个小组(或等级),每组能力组距相等,若考试成绩所测得的分数是正态的,问 A、B、C、D、E 各组应当分布几名学生?分析步骤:统计学 BASIC -21-例题例题:确定录取分数线(要求 p/z/y 中的哪一个?)某区要在 2500 名初三学生中选 50 名学生参加全市初中物理竞赛。已知该区初三上学期物理考试成绩近似正态分布,且平均数 57 分,标准差 16 分。若以这次考试为准来选拔参加竞赛的学生,分数线应定为多少?分数线是 p、z 还是 y?分析:求入选率:例:某次考试,学生成绩正态分布,n=200 人,=66.78,=9.19,若表扬前 20 名,分数线应该是多少?求入选率:例:已知某年级 200 名学生考试成绩呈正态分布,=85 分,=10 分,学生甲的成绩为70 分,问全年级成绩比学生甲低的学生人数是多少?(学生人数是 p、z 还是 y?)例:假设 500 名学生的数学成绩分布符合正态分布。且已知平均分 70,标准差 5 分。试问6080 分学生的人数分布为多少?分析:已知:N=500,M=70,SD=5,(P Z M,SD,X)1 统计学 BASIC -22-第四章 抽样分布与参数估计 第一节 抽样分布 总体分布(population distribution):总体内个体观察值的次数分布或概率分布。样本分布(sample distribution):样本内个体观察值的次数分布或概率分布。抽样分布 (sampling distribution):样本统计量的概率分布。一个统计量的抽样分布:从同一总体重复抽样时,统计量会有什么样的值值,以及每个值出现的频率?一、抽样分布与抽样误差估计(一)抽样分布的定义(二)抽样误差:由抽样的随机性引起的样本统计量与总体参数之间的差异。.标准误 定义:统计量在抽样分布上的标准差。符号:SE(Standard Error)解释:SE 越小,样本统计量与总体参数越接近,样本对总体的代表性越好,用样本统计量推断总体也越可靠。?练习:请问下列标准误的含义是什么?思考:试比较标准误与标准差的异同。同:都是离中趋势的指标。异:S:一般变量值(原始数据)离中趋势的指标。SE:样本统计量离中趋势的指标。统计学 BASIC -23-二、样本平均数的抽样分布(一)抽样分布形态的影响因素:1.总体的分布形态 2.样本容量的大小 3.要计算的统计量(二)中心极限定律 若总体正态,则从中抽取容量为 n 的 一切可能样本的均数分布也呈正态;无论总体是否正态,只要 n 足够大,样本均数的分布接近正态分布。(三)自由度 定义:推断统计中,变量值独立自由变动数值的数目。符号:df(degree of freedom)例如:现有一个 n=5 的样本,其样本均值为 6 若前 4 个数据可以随意确定为 3,6,7,9 则第五个数据必须为 5,因为受到X=30 的限制,即 df=n-1 其中的 1 表示只有一个限制因素X=30 注意:统计方法不同,自由度算法不同(四)常用的抽样分布 正态分布及渐近正态分布:t 分布、F 分布、1.正态及渐近正态分布 总体正态,已知,样本均数分布为正态。?练习:审计师从 1000 份应收帐款的总体中抽取了一份容量 n36 的随机样本。该应收帐款的总体均值是,总体标准差是 。(1)样本均值小于 250¥的概率是多少?(2)样本均值在总体均值 15¥范围内的概率是多少?2.t 分布分布(1)定义:由小样本统计量形成的概率分布。(2)特点:对称分布 曲线易变,不是一条而是一簇。n时,t 分布与标准正态分布完全吻合(3)t 分布的使用 总体正态,n30 时,样本平均数分布为 t 分布。统计学 BASIC -24-总体非正态,n30,样本均数的分布为 t 分布或渐近正态分布。?练习:t 分布曲线与正态分布曲线的不同之处在于:A.对称性 B.以横轴为渐近线 C.随自由度变化而变化 D.曲线下面积为 1?练习:总体为正态,总体方差已知时,平均数的抽样分布为:A.t 分布 B.F 分布 C.正态分布?练习:某市随机抽取小学三年级学生 60 名,测得平均体重为 28kg,标准差 3.5kg。试问该市小学三年级学生的平均体重大约是多少?练习:某教师用韦氏成人智力量表测 100 名高三学生,M=115。试估计该校高三学生智商平均数大约为多少?第二节 参数估计的基本原理 一、推论统计概述(一)推论统计的定义 (二)推论统计的主要内容 (三)统计推断的有关问题:统计推断的前提 随机抽样 样本 一定的规模及代表性 推断错误 一定限度 二、参数估计的概念 引子:什么是估计?根据你拥有的信息对现实世界进行某种判断。由衣着、言谈和举止判断其可由一个人的统计学 BASIC -25-脸色,猜测其 统计中的估计也不例外,它是完全根据数据数据做出的。举例:如果我们想知道全国 10 岁儿童的平均身高,人们只有通过抽样调查以得到样本,并用样本数据来估计真实平均数。从不同的样本得到的结论也不会完全一样。虽然真实的平均数在这种抽样过程中永远也不知道;但可以知道估计的均数和真实的均数大致差多少。三、良好点估计量的特征(1)无偏性:是指每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的参数。(2)有效性:找方差最小的估计量 方差小说明反复抽样产生的许多估计量差别不大,因此更加精确。其他标准 涉及大样本的极限性质 四、区间估计的原理 (置信度、可信度)(二)术语:置信区间、置信度、显著性水平、置信限 1.置信区间 置信度,即置信概率,是指作出某种推断时正确的可能性(概率)。置信区间,也称置信间距(confidence interval,CI)是指在某一置信度时,总体参数所在的区域距离或区域长度。(置信区间是带有置信概率的取值区间)定义:特定可靠性下,估计总体参数所在的区间范围。公式:2.置信度:定义:被估计参数落在置信区间内的概率。别名:置信水平、置信系数、置信概率、可信系数 3.显著性水平 对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平(significance level)就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号表示。4.置信限 定义:被估计总体参数所在区间的上、下界限。统计学 BASIC -26-总结:总结:(1.96 为置信度或置信水平)置信度是人为给定的,心理统计中常用 95和 99 置信水平为 95时,置信水平为 99时,?练习:某大学大学生睡眠时间平均为 6 小时。有 95的把握说这个大学的学生平均睡眠时间在 5 到 7 个小时之间。(1)这里的5,7是什么?(置信区间)(2)95%是什么?(置信度或置信水平)影响置信区间大小的因素:、(三)置信度与置信区间 简而言之:点估计给出一个数字,用起来很方便;区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。思考:置信区间与置信度的关系如何?如果选择 99%而不是 95%的水平。提高了置信水平,则增加了置信区间的宽度,降低了估计的精确性。要求:区间适度、置信度较高 推论统计的小概率原则:推论统计的小概率原则:在一个已知假设下,如果一个特定观测事件的概率格外小,我们就认为,这个假设很可能是不对的。第五章 平均数的差异性 t 检验 在不同条件下测得不同的数据样本后,必须对样本数据的差异来源作出判断:该差异是否意味着他们各自所在的总体存在差异?平均数存在差异,则需要判断该差异是偶然因素引起的还是实验条件引起的 统计学 BASIC -27-第一节 假设检验的原理 一、(一)假设 产生差异的情况:A.样本统计量与相应总体参数的差异;B.两个样本统计量之间的差异;差异性质:a)真实差异:实验条件(系统因素)引起的 b)(抽样)误差:在统计上是忽略不计的,不被视为真正的差异,即偶然因素引起的 注意:A.假设检验并不是对假设的正确性做出正确的判断,而是对一个不确定问题的决策过程,其结果从概率上很有可能是正确的,但不排除错误的可能性。B.零假设和备选假设哪一个正确,这是确定性的,没有概率可言。而可能犯错误的是人。虚无假设(无差/零 假设)定义:根据检验结果予以拒绝或接受的假设 内容:假设两个均数之间差异是误差。表示:研究假设(备择假设)定义:研究者希望证实的假设。内容:假设两均数之间存在真实的差异。表示:零假设零假设(H0):“正在研究的两个变量无关”或“变量之间无差异”如:卡路里每天的摄入量与体重无关。反应时间与问题解决能力无关。1 年级的 CECT-4 平均成绩与 4 年级无差异。男生与女生的平均数学成绩无差异。POP Music 与 Classic 组平均记忆成绩无差异。?思考:想了解参与入学准备项目的儿童与没有参与的儿童在学习成绩上是否存在差异。零假设:参与入学准备的儿童与没有参与的平均成绩无差异 研究假设:参与入学准备的儿童与没参与的平均成绩有差异 作为优秀的工作者,就应尽最大可能地去解释:两个群体之间的差异仅仅是由于入学准备项目(系统因素)引起的,而不是其他任何因素或者因素的组合(误差,如如父母受教育程度、家庭孩子的数量等等)。一旦消除了其他潜在的解释变量,唯一留下的对差异的解释就是入学准备的影响。可以完全消除其他潜在的解释变量?不可以!为什么?统计学 BASIC -28-不能确定样本的代表性即所研究的样本是否很好地代表总体。即使样本能很好地代表总体,也始终存在影响结论的其他因素,而且在实验设计的过程中总会遗漏这些因素。因此,研究中始终存在错误的可能性。那么,如果推断考试成绩的不同是由于是否参与入学准备项目,就得承受一定的风险。实际上风险水平就是愿意执行的统计显著性水平。?思考:比较 一组篮球队员 和 一组足球队员 的跑步速度 可能有一些我们不知道的偶然因素导致了差异。篮球队员更强壮?或足球队员进行了更多的跑步练习?或两组都进行了额外的训练?测定速度的方式就有很多偶然因素:秒表、测试当天的天气 作为好的研究者,应该 观察到差异时消除偶然性因素,并评价其他可能导致群体差异的因素。如有目的的训练或营养计划,并分析这些因素如何影响速度。注意:研究报告与毕业论文。通常来说:只报告研究假设,不报告零假设。(二)假设检验(二)假设检验 假设检验是一种带有概率性质的反证法。其具体过程是:显著性的含义 两个(或多个)变量之间的差异是由系统因素影响的,而不是偶然性因素。换句话:两个(或多个)变量之间的差异是稳定存在的,而不是抽样误差引起的。注意:差异的显著性不是指差异的大小。显著性:举例说明 假定:母亲工作和不工作的大学生对就业的态存在显著差异。这里所说的显著性,是指两个群体态度之间的任何差异是由于系统因素的影响;而不是偶然因素。而本案例中的系统因素是 母亲是否工作。需要表明:即使很确信两种大学生群体之间的差异是由于母亲的就业状态引起的,但始终不能 100%、绝对地、肯定地、毫无疑问地或毫不含糊地确信这一点。这个结论是错误的可能性始终存在,不论这个可能性有多小,多么微不足道但始终存在!显著性水平显著性水平 含义:拒绝零假设的概率。常用水平值:解释:直观分析法;理论分析小概率事件 统计学 BASIC -29-直观分析:直观分析:?思考:为什么显著性有.05 .05 .01.01 还有.001.001?好比一个身高 180 厘米的男生,可能愿意被认为高于或等于 180 厘米,而不愿意说他高于或等于 155 厘米,虽然这第二种说法数学上没有丝毫错误。(三)(三)小概率原理小概率原理 a)小概率事件:一次试验中发生可能性很小,大量重复试验终究发生的事件。b)0.05 的随机事件为小概率事件。c)检验:随机样本统计量在抽样分布上出现的 p0.05(或(或 0.01),则以小概率事件拒绝拒绝Ho。假设检验中,H0总是作为直接被检验的假设。二、二、误差分析误差分析,95%为真实差异,5%为误差(一)检验方法 1、双侧(尾)检验 统计学 BASIC -30-定义:拒绝性概率置于理论分布两尾。使用:结果或方向不确定时。意义:只推断有无差异,不断言方向。2、单侧(尾)检验 定义:拒绝性概率置于理论分布一尾。使用:结果或方向确定时。意义:即推断有无差异,又断言方向。类型:右尾检验、左尾检验 a.右尾检验 定义:拒绝性概率置于理论分布的右尾。使用:能确定一个总体大于另一总体时。假设形式:b.左尾检验 定义:拒绝性概率置于理论分布的左尾。使用:能确定一个总体小于另一总体时。假设形式:统计学 BASIC -31-三、统计决策的两类错误 想降低型错误,我们能做的:A.降低显著性()()水平,从=0.05(5%)变为变为=0.01(1%)B.若想不犯型错误,则 应尽可能接近零 a)即不做任何解释。b)如果我们想对一些问题进行解释,就不得不接受在一定程度上犯型错误的风险(可能性)。C.降低显著性水平是一种严谨或保守的做法,有时可能是有效的。而科学研究最重要的工作是尽力对因果关系进行推测。D.如果过于降低型错误,有失科学的严谨。两类错误的关系:两类错误的关系:四、四、假设检验的一般过程假设检验的一般过程 a)提出(或建立)假设 H0:H1:b)规定显著性水平 a=0.05 a=0.01 c)计算统计检验值 d)比较与决策 统计学 BASIC -32-第二节 单总体均数的差异检验 检验方法:总体正态、总体非正态(1)总体正态 (2)总体非正态,n30 (渐进正态法)(3)检验过程 第三节 双总体均数之差检验 样本性质:独立样本:从两无关总体抽取的两个样本。相关样本:从相关总体抽取的两个样本。同组比较:同组前后比较。配对样本:同质被试两两配对形成样本的先后比较。统计学 BASIC -33-一、检验方法与过程(一)方法:Z 检验、t 检验 Z检验:检验:t检验检验 统计学 BASIC -34-?练习:练习:饮食障碍因为其严重性得到了研究者的关注。他们分别对 297 个澳大利亚大学生和 249个印度大学生进行这项比较研究。每个学生都参加了饮食态度测试和肥胖恐惧量表测试。然后比较群体得分,看在这两个方面,两个国家的大学生是否存在文化差异。问题 1:采用何种方法进行计算 问题 2:若饮食态度测试的结果是 统计学 BASIC -35-第四节 差异是真实的吗:理解效应量 研究者检验了参与社区自助服务(例如扑克牌游戏、野外旅行等)是否提高了美国老年人的生活质量(从 1 到 10 分为 10 个等级)。研究者执行了为期 6 个月的服务项目,在项目结束后测量两个群体的生活。两个群体由50 位 80 岁以上的老人构成,其中一个群体得到服务而另一个没有得到。差异是显著的,但差异有多大?一、一、计算和理解效应量(计算和理解效应量(effect size)与其他统计技术相同,计算效应量(effect size)的方式有多种。下面介绍最简单最直接的方法。(一)(一)计算效应量计算效应量:效应量 0.37 意味着什么?通常采用如下标准进行判断:0.00.20 小效应量小效应量 0.200.50 中等中等 0.50 及以上大效应量及以上大效应量 统计学 BASIC -36-(二)理解效应量效应量 刚才的 0.37 到底意味着什么?效应量:即每个群体相对于另外一个群体的位置。效应量:即每个群体相对于另外一个群体的位置。例如:ES=0,意味着两个群体非常相似且几乎完全重叠两个分布之间没有差异。ES=1,意味着两个群体大约有 45%