体育统计第六章.ppt
体育统计教案体育统计教案浙浙江江师师范范大大学学体体 育育 学学 院院 张夏榕张夏榕 第六章第六章 统计推断统计推断 一、统计推断概念统计推断概念 1.样本、总体符号的表示S 样本的均数 样本的标准差?总体的均数总体的均数总体的标准差总体的标准差 第六章第六章 统计推断统计推断一、统计推断概念统计推断概念2.2.抽样误差抽样误差 由由于于抽抽样样造造成成,样样本本均均数数与与总总体体均均数数的的偏偏差差,为为均均数数的抽样误差。的抽样误差。标准误标准误抽样误差的大小抽样误差的大小 样本均数与总体均数间样本均数与总体均数间的偏差程度的偏差程度 例例:一一个个总总体体,=5.4cm=5.4cm,=170cm=170cm,抽抽取取二二个个样本,人数分别为样本,人数分别为3636人与人与12961296人,求标准误。人,求标准误。解:解:样本样本1 1 样本样本2 2 个体与均数个体与均数差异差异5.45.4cm cm 小样本均数小样本均数与总体均数与总体均数差异差异0.90.9cm cm 大样本均数大样本均数与总体均数与总体均数差异差异0.150.15cm cm 标准差与标准误标准差与标准误区别与联系区别与联系 标准误标准误标准差标准差符号符号描述对象描述对象 意义意义 联系联系 S()S()各个体值各个体值 反映个体值间的差异程度反映个体值间的差异程度 样本均数样本均数 反映均数的抽样误差反映均数的抽样误差 3.中心极限定理中心极限定理 当n 很大时或数据符合正态分布,样本均数 服 服从平均数,标准差为 的正态分布 第六章第六章 统计推断统计推断二、参数估计二、参数估计 用样本统计量来估计总体参数用样本统计量来估计总体参数 1.1.点估计点估计 已知已知 、S S 认为认为=S=S2.2.区间估计区间估计 二、参数估计二、参数估计 用样本统计量来估计总体参数取值范围用样本统计量来估计总体参数取值范围 置信置信区间区间 在区间估计中,预选规定概率为置信概率 置信概率一般为置信概率一般为9595,9999 确定总体参数取值范围为置信区间确定总体参数取值范围为置信区间 2.2.区间估计区间估计 9595置信区间置信区间 9999置信区间置信区间 总体均数落在总体均数落在此区间的概率此区间的概率为为9595 例例:在在浙浙江江省省,随随机机抽抽查查一一个个人人数数为为12961296的的成成人人男男子子的的样样本本,得得身身高高 =170.3=170.3cm cm,s,s=5.4cm=5.4cm,试试估计浙江省成年男子的平均身高。估计浙江省成年男子的平均身高。解:解:根据点估计:=170.3cm、=S=5.4cm 区间估计:取置信概率为区间估计:取置信概率为95950.15=170.006cm=170cm 0.15=170.006cm=170cm=170.3+1.96=170.3+1.960.15=170.594cm=170.6cm0.15=170.594cm=170.6cm 故估计浙江省成年故估计浙江省成年男子的平均身高在男子的平均身高在170170.6170170.6范围范围 总体均数常用表示总体均数常用表示 浙江省成年男子的平均身高浙江省成年男子的平均身高 四、假设检验的基本思想和步骤四、假设检验的基本思想和步骤 例例1 1:根根据据资资料料,体体育育学学院院男男生生100100m m 成成绩绩 ,今今年年体体育育学学院院男男新新生生100100名名男男生生,入入学学时时100100m m 成成绩绩 =12.1=12.1。试试问问今今年年男生成绩与往年学生有否不同,为什么?男生成绩与往年学生有否不同,为什么?例例2 2:某地:某地19801980年体质调查得知,抽取年体质调查得知,抽取1212岁男生岁男生414414人,肺人,肺活量活量 =2378.7ml=2378.7ml,抽取抽取1212岁女生岁女生410410人,肺活量人,肺活量 =2298.1=2298.1mlml,按照历年资料,男生标准差按照历年资料,男生标准差 ,女生,女生标准差标准差 ,问,问1212岁男女肺活量有否差异?岁男女肺活量有否差异?1.1.问题的提出问题的提出 例例1 1:根根据据资资料料,体体育育学学院院男男生生100100m m 成成绩绩 ,今今年年体体育育学学院院男男新新生生100100名名男男生生,入入学学时时100100m m 成成绩绩 =12.1=12.1。试试问问今今年年男生成绩与往年学生有否不同,为什么?男生成绩与往年学生有否不同,为什么?体育学院体育学院学生学生新生新生100100人人新生的总体新生的总体样本代表样本代表一个总体一个总体1.1.问题的提出问题的提出 体育学院体育学院学生学生一个总体一个总体新生的总体新生的总体新生新生100100人人两种可能两种可能今年新生平均水平同往年相同,12.1与12.5的差距是总体与样本的差异,由抽样误差造成的 今年新生平均水平同往年不同,。1.1.问题的提出问题的提出 同理例同理例2 2两种可能两种可能例例2 2:某地:某地19801980年体质调查得知,抽取年体质调查得知,抽取1212岁男生岁男生414414人,肺人,肺活量活量 =2378.7ml=2378.7ml,抽取抽取1212岁女生岁女生410410人,肺活量人,肺活量 =2298.1=2298.1mlml,按照历年资料,男生标准差按照历年资料,男生标准差 ,女生,女生标准差标准差 ,问,问1212岁男女肺活量有否差异?岁男女肺活量有否差异?12岁男女肺活量无差异,2378.7与2298.1的差距是样本与样本的差异,由抽样误差造成的 12岁男女肺活量有差异,。女生的总体女生的总体女生女生410410人人男生的总体男生的总体男生男生414414人人(1 1)基本思想)基本思想1.1.问题的提出问题的提出 例例1 1:根根据据资资料料,体体育育学学院院男男生生100100m m 成成绩绩 ,今今年年体体育育学学院院男男新新生生100100名名男男生生,入入学学时时100100m m 成成绩绩 =12.1=12.1。试试问问今今年年男生成绩与往年学生有否不同,为什么?男生成绩与往年学生有否不同,为什么?1)假设:今年新生平均水平同往年相同,即:12.1与12.5的差距是总体与样本的差异,由抽样误差造成的 2)确定P 的概率 3)如果P 很小,那么相等的可能性很小,原假设不成立。否则,原假设成立。1.1.问题的提出问题的提出 例例1 1:根根据据资资料料,体体育育学学院院男男生生100100m m 成成绩绩 ,今今年年体体育育学学院院男男新新生生100100名名男男生生,入入学学时时100100m m 成成绩绩 =12.1=12.1。试试问问今今年年男生成绩与往年学生有否不同,为什么?男生成绩与往年学生有否不同,为什么?(2 2)关键如何确定关键如何确定P P?新生的总体新生的总体就是老总体就是老总体新生新生100100人人 0=12.595%95%例例1 1:根根据据资资料料,体体育育学学院院男男生生100100m m 成成绩绩 ,今今年年体体育育学学院院男男新新生生100100名名男男生生,入入学学时时100100m m 成成绩绩 =12.1=12.1。试试问问今今年年男生成绩与往年学生有否不同,为什么?男生成绩与往年学生有否不同,为什么?0=12.595%95%原假设成立原假设成立接受域接受域P 0.05P 1.96 故:故:P 0.05P 0.055)结论:原假设不成立,今年新生平均水平同往年不同,差异显著。2.2.假设检验的步骤假设检验的步骤 (1 1)根据实际情况建立)根据实际情况建立“原假设原假设”H H0 0。原假设有原假设有(2)(2)在检验假设的前提下,选择和计算统计量在检验假设的前提下,选择和计算统计量 统计量有统计量有u,t,Fu,t,F,(3)(3)确定显著水平确定显著水平,一般取一般取 =0.05=0.05或或=0.01=0.01,并根据并根据查出相应的临界值。查出相应的临界值。(4)(4)比较,判断结果比较,判断结果 (5 5)结论)结论 P0.05,P0.05,差异显著差异显著P 0.01P 0.01,差异非常显著差异非常显著P P 0.050.05,差异不显著差异不显著如:男女(如:男女(P0.05)P2.58 故:故:P 0.01P 0.015)结论:原假设不成立,12岁男女肺活量差异非常显著。原假设为 。A.B.C.D.3.如果检验统计量临界值,那么那么结论为 。A.差异显著 B.差异不显著 C.差异非常显著 D.差异非常不显著 1如果P0.01,那么结论为 。A.差异显著 B.差异不显著 C.差异非常显著 D.差异非常不显著 2.为了了解18岁男女学生的100米成绩水平有否不同,现抽测了男1500名,得均值 ,标准差S 1;女生1512人,均值为 ,标准差为S 2,如果要检验18岁男女学生的100米成绩水平是否有差异 五、均数检验的方法五、均数检验的方法 2.t2.t检验(小样本检验)检验(小样本检验)例例:已已知知浙浙江江省省1818岁岁女女生生身身高高 ,现现抽抽测测某某校校1818岁岁女女生生3636人人,得得身身高高 =157.4=157.4,S S=5.34cm=5.34cm,问问该该校校1818岁岁女女生生身高水平是否低于浙江省水平?身高水平是否低于浙江省水平?检验目的:检验目的:=0 0 但但n n 很小很小且且未知未知 2.t2.t检验(小样本检验)检验(小样本检验)T T分布分布规定 为服从自由度为 的t 分布,记t()U U 分布分布正态正态分布分布T T分布分布当当n n 时,时,t()t()u u 分布分布五、均数检验的方法五、均数检验的方法 (1)(1)样本与总体的均数检验样本与总体的均数检验 检验目的检验目的 条件条件 检验统计量检验统计量 当当n n较小,较小,未知时未知时 2.t2.t检验(小样本检验)检验(小样本检验)临界值与临界值与n n有关有关自由度自由度要查表要查表 1)假设:18岁女生身高水平与浙江省水平差异不显著,即:2)求统计量 例例:已已知知浙浙江江省省1818岁岁女女生生身身高高 ,现现抽抽测测某某校校1818岁岁女女生生3636人人,得得身身高高 =157.4=157.4,S S=5.34cm=5.34cm,问问该该校校1818岁岁女女生生身高水平是否低于浙江省水平?身高水平是否低于浙江省水平?3)求临界值t t 0.050.05=2.03=2.03t t 0.010.01=2.724=2.7244)判断:t=0.8990.05 查表查表(5 5)结论:差异不)结论:差异不显著,故认为显著,故认为0.80.8cm cm 的差异很大程度上的差异很大程度上可能是由抽样误差可能是由抽样误差造成的造成的 P(2)P(2)与与P(1)P(1)一种可能一种可能另一种可能另一种可能原假设原假设记记H H 0 0无效假设无效假设备择假设备择假设记记H H 1 1 都有可能都有可能 排除一种排除一种双侧检双侧检验验记记P P(2)(2)单侧检验单侧检验记记P(1)P(1)临界值:记临界值:记临界值:记临界值:记(2)(2)样本与样本的均数检验样本与样本的均数检验 检验目的检验目的 条件条件 检验统计量检验统计量 当当n n1 1、n n2 2较小,较小,1 1、2 2未知时未知时 2.t2.t检验(小样本检验)检验(小样本检验)自由度自由度n=nn=n1 1+n+n2 2-2-2例例:为为了了考考察察体体育育课课效效果果,某某校校在在本本科科生生中中二二年年级级未未与四年级未不同时间,各抽查与四年级未不同时间,各抽查5050人,统计数据如下:人,统计数据如下:二年级未:二年级未:=16 =16秒,秒,S S1 1=0.8=0.8四年级未四年级未 =16.95 =16.95秒,秒,S S1 1=0.92=0.92问停开体育课后,百米成绩是否下降?问停开体育课后,百米成绩是否下降?(1 1)H H0 0:1=1=2 2 H H1 1:1 1 t 0.01(98)=2.364,即即P 0.01(5)(5)结论:差异非常显著结论:差异非常显著故停开体育课后,百米成绩下降了故停开体育课后,百米成绩下降了 2.在均数检验中,大样本检验为 检验,小样本检验为 检验。1.为了了解18岁男女学生的100米成绩水平有否不同,现抽测了男1500名,得均值 ,标准差S 1;女生1512人,均值为 ,标准差为S 2,如果要检验18岁男女学生的100米成绩水平是否有差异,统计量为 95%95%接受域接受域t t0.050.05假设成立假设成立tttt0.050.05P P0.050.05差异不显著差异不显著9 99%9%拒绝域拒绝域拒绝域拒绝域t t0.010.01t tt t0.050.05P P0.050.05差异差异显著显著t tt t0.010.01P P0.010.01差异差异非常显著非常显著假设不成立假设不成立假设不成立假设不成立3.如果检验统计量临界值,那么那么结论为 。A.差异显著 B.差异不显著 C.差异非常显著 D.差异非常不显著 1如果P0.01,那么结论为 。A.差异显著 B.差异不显著 C.差异非常显著 D.差异非常不显著 七、假设检验在体育中的应用七、假设检验在体育中的应用 1.某年级学生体质与全省或全国水平进行比较项目项目 5050m m 铅球铅球 立定跳远立定跳远 1000 1000m m 男生男生浙江省水平浙江省水平T T值值 P P s s 7.320.317.320.31 8.438.43 0.890.89 2.38 2.380.180.18 235.2235.217.717.7 7.47 8.35 2.34 237 7.47 8.35 2.34 2374.8 0.89 2.2 1.054.8 0.89 2.2 1.050.05 0.050.05 0.05例1:浙江师范大学100名男生身体素质的比较表 七、假设检验在体育中的应用七、假设检验在体育中的应用 2.2.本年级与其它年级比较本年级与其它年级比较 身高身高 体重体重胸围胸围 肺活量肺活量 例:某学校男生入学时体质情况比较表例:某学校男生入学时体质情况比较表 167.110.29167.110.2952.3452.340.30.375.5475.540.220.22 3196.313196.3127.7527.75 166.28166.280.320.32 53.1453.140.33 0.33 79.0679.060.2 0.2 3610.63610.631.431.4 指标指标 04 04级级 03 03级级 t t 值值 P P 1.921.921.791.7911.811.89.829.820.050.050.050.050.010.01*0.010.01*1某篇论文的一个表格说明垒球运动员心理健康状况及人格特征,数据可见下表,其中SCL-90是自评量表,用以评价心理健康状况,其中数值越大,表示某特征越强烈,常模是普通人的平均水平。表1:垒球运动员SCL-90均值与常模的比较 垒球运动员(n=119)常模因子 t 临界值 P 人际敏感 1.650.048 1.75 1.98强 迫 1.900.057 1.62 焦 虑 1.610.047 1.59 偏 执 1.430.052 1.72 2.63 完成此表格。试解释以上统计数据的表述的意义。作出结论。解:(1)表1:垒球运动员SCL-90均值与常模的比较 垒球运动员(n=119)常模因子 t 临界值 P 人际敏感 1.650.048 1.75 2.08 1.98 0.05 强 迫 1.900.057 1.62 4.91 0.05 偏 执 1.430.052 1.72 5.58 2.63 0.01(2):样本均数 :标准误 :总体均数 t :检验统计量 临界值:检验临界值 P:检验显著性水平(3)经比较检验 垒球运动员人际敏感因子与常人差异显著,强迫、偏执因子与常人差异非常显著,焦虑因子与常人差异不显著。