正态分布、区间估计优秀PPT.ppt
抽样分布的特点抽样分布的特点各样本均数未必等于总体均数各样本均数未必等于总体均数;样本均数之间存在差异样本均数之间存在差异;样本均数的分布很有规律:围绕总体均数,中样本均数的分布很有规律:围绕总体均数,中间多两边少,左右基本对称;间多两边少,左右基本对称;样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均数的大缩小;随着样本含量的增加,样本均数的变异范围渐渐缩小。变异范围渐渐缩小。由于总体中由于总体中个体变异个体变异的存在,在的存在,在抽样抽样过程中过程中产生的样本统计量与总体参数间的差异称为产生的样本统计量与总体参数间的差异称为抽样误差。抽样误差。抽样误差抽样误差标准误标准误n样本统计量的标准差称为标准误。样本统计量的标准差称为标准误。n样本均数的标准差称为样本均数的标准误,样本均数的标准差称为样本均数的标准误,反映样本均数的离散程度,反映样本均数反映样本均数的离散程度,反映样本均数抽样误差大小。抽样误差大小。t分布分布n设从正态分布设从正态分布N(,2)中随机抽取含量为中随机抽取含量为n的样本,设:的样本,设:n实际工作中,总体方差未知,用样本方差实际工作中,总体方差未知,用样本方差代替,此时:代替,此时:t分布,分布,=n 1 n单单峰峰分分布布,曲曲线线以以0为为中中心心,左左右右对对称称类类似于标准正态分布。似于标准正态分布。nt分布的形态与自由度分布的形态与自由度 有关有关t分布曲线分布曲线-t/2,vt/2,v双侧:双侧:P(t-t/2,)+P(tt/2,)=P(-t/2,t t/2,)=1-1-1-n参数估计:由已知的样本统计量推断总体参数估计:由已知的样本统计量推断总体参数。参数。n参数估计:点估计和区间估计;参数估计:点估计和区间估计;n区间估计:区间估计:n 假设某个总体的均数为假设某个总体的均数为,须要找,须要找到两个数值到两个数值A和和B,使得在一个比较高的可,使得在一个比较高的可信度下信度下(如如95%),区间,区间(A,B)能包含能包含。即。即nP(A n/2,所以用,所以用n X=6查附表查附表6,得,得8 38,即无效概率的,即无效概率的95%置信置信区间为区间为8%38%,因此有效概率的,因此有效概率的95%置置信区间为信区间为62%92%。例例5-8 用某种仪器检查已确诊的乳腺癌患者用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者名,检出乳腺癌患者94例,检出率为例,检出率为78.3%。估计该仪器乳腺癌总体检出率的估计该仪器乳腺癌总体检出率的95%置信区间。置信区间。解解:n比较大,且比较大,且np=94及及n(1 p)=26均大于均大于5,所以可用正态近似法估计总体概率的置信区,所以可用正态近似法估计总体概率的置信区间。间。2 正态近似法正态近似法data aa;input p n;Sp=sqrt(p*(1-p)/n);y1=p-1.96*Sp;/*可信区间的下限*/y2=p+1.96*Sp;/*可信区间的上限*/cards;0.783 120;proc print;run;作业P83 6题 7题n6.某探讨表明新研制的一种安眠药比旧安眠药增加睡眠某探讨表明新研制的一种安眠药比旧安眠药增加睡眠时间。某医师从已确诊的神经衰弱病人中随机抽取了两时间。某医师从已确诊的神经衰弱病人中随机抽取了两份样本份样本,一份样本是一份样本是20例病人服用该种新药,计算得到例病人服用该种新药,计算得到平均睡眠时间为平均睡眠时间为6.39小时小时,标准差为标准差为2.24小时小时;另一份另一份样本是样本是93例病人也服用该种新药,计算得到平均睡眠例病人也服用该种新药,计算得到平均睡眠时间为时间为6.45小时小时,标准差为标准差为2.51小时。若睡眠时间听从小时。若睡眠时间听从正态分布,试分别估计这种新安眠药的平均睡眠时间的正态分布,试分别估计这种新安眠药的平均睡眠时间的95%置信区间;并比较这两个区间有何不同,用哪一置信区间;并比较这两个区间有何不同,用哪一个估计总体参数更牢靠?个估计总体参数更牢靠?n7.为了解中年男性高血压患病状况,某探讨单位在某市为了解中年男性高血压患病状况,某探讨单位在某市城区随机调查了城区随机调查了4554岁男性居民岁男性居民2660人,检查出高人,检查出高血压病人血压病人775人,试估计该市中年男子高血压患病率的人,试估计该市中年男子高血压患病率的95%置信区间。置信区间。