《总体均数的估计.pptx》由会员分享,可在线阅读,更多相关《总体均数的估计.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量 参参 数数 统计推断第一节第一节 均数的抽样误差均数的抽样误差如:样本均数 样本标准差S 样本率 P如:总体均数 总体标准差 总体率 抽样误差 (sampling error):由于个体差异导致的样本统计量与总体参数间的差别。第1页/共81页一、均数的抽样误差一、均数的抽样误差 从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n10、样本含量n30的抽样实验;比较
2、计算结果。第2页/共81页图示:总体与样本populationpopulationsample2sample2sample1sample1sample3sample3sample4 sample4 sample5sample5第3页/共81页抽样试验(抽样试验(n n=30=30)第4页/共81页抽样实验结果图示抽样实验结果图示第5页/共81页总体正态分布正态分布 总体中个体的变异程度sample1sample1sample2sample2sample3sample3Sample nSample n正态分布正态分布 均数的变异程度第6页/共81页10001000份样本抽样计算结果份样本抽样计算
3、结果总体的总体的均数均数总体标总体标准差准差s s均数的均数的均数均数均数标准差均数标准差5.005.000.500.505.005.000.09200.09200.09130.0913第7页/共81页小结小结 均数的均数围绕总体均数上下波动。均数的标准差即标准误 ,与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error)=样本标准差/第8页/共81页实例:如某年某市120120名1212岁健康男孩,已求得 均数为143.07143.07cmcm,标准差为5.705.70cmcm,按公式计算,则标准误为:第9页/共81页1.表示抽样误差的大小,也是说明样本 均数估
4、计总体均数可靠程度的指标2.进行总体均数的区间估计;3.进行均数的假设检验等。标准误的应用 第10页/共81页标准差和标准的联系和区别联系 在样本含量一定的情况下,标准误和标准差成正比区别 标准差:个体观察值的变异程度 标准误:样本均数的变异程度同一总体,标准误与样本含量的平方根成反比第11页/共81页二、二、t t分布分布随机变量XN(m m,s s2)标准正态分布N(0 0,1 12)u变换均数标准正态分布N(0 0,1 12)Student t分布自由度:n-1第12页/共81页t t分布曲线分布曲线 t 分布有如下性质:单峰分布,曲线在t0 处最高,并以t0为中心左右对称与正态分布相比
5、,曲线最高处较矮,两尾部翘得高(见蓝线)随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。t分布曲线是一簇曲线,而不是一条曲线。分布曲线是一簇曲线,而不是一条曲线。第13页/共81页t t分布曲线下面积(附表分布曲线下面积(附表2 2)双侧t0.05/2,92.262 单侧t0.025,9单侧t0.05,91.833双侧t0.01/2,93.250 单侧t0.005,9单侧t0.01,92.821双侧t0.05/2,1.96 单侧t0.025,单侧t0.05,1.64第14页/共81页可见在相同的自由度时,|t|值增大,概率P减少;反之,|t|值减小,概率P增大。在相同|t|值时,
6、双尾概率P为单尾概率P的两倍。第15页/共81页复习标准误和抽样误差标准误的计算公式标准差和标准误的联系和区别t分布的特征t分布的面积第16页/共81页参数估计:用样本指标(统计量)估计 总体指标(参数)称为参数估计。估计总体均数的方法有两种,即:点值估计(point estimation)区间估计(interval estimation)三三 总体均数的区间估计总体均数的区间估计第17页/共81页(一)、点值估计 点值估计:是直接用样本均数作为总体均数的估计值。此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。第18页/共81页(二)
7、、区间估计 区间估计是按一定的概率(1-)估计包含总体均数可能的范围,该范围亦称总体均数的可信区间(confidence interval,缩写为CI)。1-称为可信度,常取1-为0.95和0.99,即总体均数的95%可信区间和99%可信区间。1-(如95)可信区间的含义是:总体均数被包含在该区间内的可能性是1-,即(95),没有被包含的可能性为,即(5)。准确度、精度第19页/共81页总体均数的可信区间的计算 1.1.未知且n n较小(n n100)100),可用u检验。不同的统计检验方法,可得到不同的统计量,如t 值和u值。在H H0 0成立的前提下第30页/共81页第31页/共81页(1
8、)建立检验假设 H0:0,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数相同;H1:0,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数不同。0.05(双侧)(2)计算u值 本例n=100,s=6.6,样本均数=73.8,总体均数=72,代入公式第32页/共81页4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。u u,则P u 。本例查u界值表,得u0.01=2.58,现u=2.73u0.01,故P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即
9、差异无统计意义,如例3.3 尚不能认为两总体脉搏均数有差别。第34页/共81页 按=0.05的水准,拒绝H0,接受H1,差异无统计学意义。结论:即根据本资料可以认为此山区健康成年男子脉搏数与一般健康成年男子不同。第35页/共81页下结论时的注意点:P ,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现;同理,P ,不拒绝H0,更不能认为H0肯定成立。由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误 第36页/共81页v国外统计书籍及统计软件亦称为单样本u检验(one sam
10、ple u-test)。v样本均数与总体均数比较的u检验适用于:v总体标准差已知的情况;v样本含量较大时,比如n100时。对于后者,是因为n较大,也较大,则t分布很接近u分布的缘故。(一)样本均数与总体均数比较的u检验七七 均数的均数的u u检验检验第37页/共81页u u 值的计算公式为:总体标准差已知时,不管n的大小总体标准差未知时,但n100时。第38页/共81页例3.43.4 某托儿所三年来测得21212424月龄的4747名男婴平均体重11kg11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg11.18kg,标准差为1.23kg1.23kg。问该托儿所男婴的体重
11、发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)第39页/共81页(1)建立检验假设 H0:0,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同,H1:0,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同。0.05(双侧)(2)计算u值本例n=47,样本均数=11,总体均数=11.18,总体标准差=1.23,代入公式第40页/共81页(3)确定P值,作出推断结论 查u界值表,得u0.20=1.28,u=1.0030.20。按=0.05水准,不拒绝H0,差异无统计学意义。结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。第41页/共81页
12、复习估计方法:点估计,区间估计区间估计 95%,99%方法:t分布原理 u分布原理总体均数被包含在该区间内的可能性是1-总体均数估计和参考值范围制定的区别第42页/共81页(二)两样本均数比较的u u检验该检验也称为独立样本u检验(independent sample u-test),适用于两样本含量较大(如n150且n250)时,u值可按下式计算:第43页/共81页 例3.53.5 测得某地20202424岁健康女子100100人收缩压均数为15.27kPa15.27kPa,标准差为1.16kPa1.16kPa;又测得该地20202424岁健康男子100100人收缩压均数为16.11kPa1
13、6.11kPa,标准差为1.41kPa1.41kPa。问该地20202424岁健康女子和男子之间收缩压均数有无差别?第44页/共81页(1)建立检验假设 H0:1 2,即该地2024岁健康女子和男子之间收缩压均数相同;H1:12,即该地2024岁健康女子和男子之间收缩压均数不同。0.05(双侧)(2)计算u值 本例 n1=100,均数1=15.27,S1=1.16 n2=100,均数2=16.11,S2=1.41第45页/共81页(3)确定P值,作出推断结论 查u界值表,得u0.05=1.96,现uu0.05=1.96,故P0.05。按水准=0.05,拒绝H0,接受H1,差异有统计学意义。结论
14、:可认为该地2024岁健康人的收缩压均数男性高于女性。第46页/共81页六六 均数的均数的 t t 检验检验 vt检验的适用条件:样本来自正态总体或近似正态总体;当样本含量较小(如n 3.690,故P0.001。按=0.05的水准,拒绝H0,接受H1。结论:即根据本资料可以认为从事该项特殊作业的成年男性血红蛋白含量与一般人不同,低于一般人。第51页/共81页可信区间和假设检验的联系可信区间可以解释假设检验的问题 上例n=28,s=8 =128.6,=140.2 总体可信区间为 (125.5,131.7)g/L 该范围未包含总体均数140.2,故可以认为从事该项特殊作业的成年男性血红蛋白含量与一
15、般人不同,低于一般人。第52页/共81页医学科研中配对资料的三种主要类型:同一批受试对象治疗前后某些生理、生化指标的比较;同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;配对动物试验,各对动物试验结果的比较等。配对实验设计得到的资料称为配对资料。(二二)配对资料的配对资料的t t检验检验第53页/共81页v检验步骤 先求出各对子的差值d的均值,若两种处理的效应无差别,理论上差值d 的总体均数应为0。所以这类资料的比较可看作是样本均数与总体均数为0的比较。要求差值的总体分布为正态分布。v t检验的公式为:第54页/共81页例3.73.7 设有1212名志愿受试者服用某减肥药,服药
16、前和服药后一个疗程各测量一次体重(kg)(kg),数据如表3-43-4所示。问此减肥药是否有效?(1)建立检验假设 H0:d=0,即该减肥药无效;H1:d0,即该减肥药有效。单侧=0.05 第55页/共81页 某减肥药研究的体重(kgkg)观察值 第56页/共81页(2)计算t值本例n=12,d=-16,d2=710,差值的均数=d/n=-16/12=-1.33(kg)第57页/共81页(3)确定P值,作出推断结论 自由度=n-1 =12-1=11,查 附 表 2,t界 值 表,得 单 侧t0.50,11=0.697,现 t=0.58 0.50。按=0.05水准,不拒绝H0,差异无统计学意义。
17、结论:故尚不能认为该减肥药有减肥效果。第58页/共81页例3.83.8 某单位研究饮食中缺乏维生素E E与肝中维生素A A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近配成8 8对,并将每对中的两头动物随机分到正常饲料组和维生素E E缺乏组,然后定期将大白鼠杀死,测得其肝中维生素A A的含量如表3-53-5。问不同饲料组的大白鼠肝中维生素A A含量有无差别?(自学内容)第59页/共81页两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independent samples t-test)。适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是
18、否相等。1、两样本总体方差相等。(三)两样本均数比较的t检验第60页/共81页样本估计值为:总体方差已知:标准误的计算公式第61页/共81页若n n1 1=n=n2 2时:已知S1和S2时:第62页/共81页例3.93.9 测得1414名慢性支气管炎病人与1111名健康人的尿中1717酮类固醇(mol/mol/2424h h)排出量如下,试比较两组人的尿中1717酮类固醇的排出量有无不同。原始调查数据如下:病 人X1:n=14;10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60健康人X
19、2:n=11;17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 第63页/共81页(1 1)建立检验假设)建立检验假设 H H0 0:1 1 2 2 ,即病人与健康人的,即病人与健康人的 尿中尿中1717酮类固醇的排出量相同酮类固醇的排出量相同H H1 1:1 1 2 2 ,即病人与健康人的,即病人与健康人的 尿中尿中1717酮类固醇的排出量不同酮类固醇的排出量不同 0.050.05 第64页/共81页(2)计算t值 本例n1=14,X1=212.35,X12=3549.0919 n2=11,X2=210.70,
20、X22=4397.64 第65页/共81页(3)确定P值 作出推断结论 =14+11-2=23,查t界 值 表,得t0.05,23=2.069,现t=1.80350.05。按=0.05水准,不拒绝H0,差异无统计学意义。结论:尚不能认为慢性支气管炎病人与健康人的尿中17酮类固醇的排出量不同。第66页/共81页两样本方差的齐性检验 用较大的样本方差S2比较小的样本方差S2 1为分子自由度,2为分母自由度 2 2、两总体方差的齐性检验和t t检验第67页/共81页v注意:v方差齐性检验本为双侧检验,但由于公式规定以较大的方差作分子,F值必然大于1,故附表3单侧0.025的界值,实对应双侧检验P=0
21、.05;v当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验。第68页/共81页深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(mg/L)表 层 水:n2=10,样 本 均 数=0.247(mg/L),S2=0.210(mg/L)例3.113.11 某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。第69页/共81页 确定P值,作出推断结论 本例18-1=7,210-1=9,查附表3,F界值表(方差齐性检验用),得F0.05,7,9=4.20,本例F80.97 F 0.05,7,9
22、=4.20;故P0.05,按=0.05 水准,拒绝H0,接受H1,结论:故可认为两总体方差不齐。第70页/共81页方差不齐时,两小样本均数的比较,可选用以下方法:变量变换,使达到方差齐的要求;采用秩和检验;采用近似法t 检验。t t 检验检验第71页/共81页计算统计量tt 值 第72页/共81页例3.12 由例3.11已知表层水和深层水含汞量方差不齐,试比较其均数有无差别?自学内容第73页/共81页假设检验中作出的推断结论可能发生两种错误:拒绝了实际上是成立的H0,这叫型错误(typeerror)或第一类错误,也称为错误。不拒绝实际上是不成立的H0,这叫型错误(typeerror)或第二类错
23、误,也称为错误。八、型错误和型错误第74页/共81页可能发生的两类错误第75页/共81页第76页/共81页联系:一般增大,则减小;减小,则增大;区别:(1)一般为已知,可取单侧或双侧,如0.05,或0.01。(2)一般为未知,只取单侧,如取0.1或0.2。1(把握度)0.75。两类错误的联系与区别第77页/共81页1-1-称为检验效能(power of test)(power of test)或把握度,其意义是两总体确有差别,按水准能发现它们有差别的能力。与的大小应根据实际情况适当取值。要同时减小两类错误的概率,唯一的办法是增加样本含量第78页/共81页1.资料要来自严密的抽样研究设计2.选用假设检验的方法应符合其应用条件 3.正确理解差别有无统计学意义的统计涵义;正确理解差别有统计学意义及临床上的差别 的统计学意义。4.假设检验的推断结论不能绝对化 5.要根据资料的性质事先确定采用双侧检验或单侧检验 应用假设检验的注意问题应用假设检验的注意问题第79页/共81页第80页/共81页感谢您的观看!第81页/共81页
限制150内