《生物统计学.ppt》由会员分享,可在线阅读,更多相关《生物统计学.ppt(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 参数估计(estimation of parameter)由样本统计量估计总体参量称为参量估计。估计量(estimator)估计总体参量的统计量。点估计(point estimate)参量估计 区间估计(interval estimate)一、点估计由样本数据所计算出来的单个数值,对 总体参量所做的估计。例如:用X 估计 用s2 估计2 用S 估计 1、无偏估计量unbiased estimator估计量 2、有效估计量efficient estimator 3、一致估计量consistent estimator1、无偏估计量:我们已知:样本平均数的数学期望等于总体平均数。E(X)=样本方差
2、的数学期望等于总体方差。E(S2)=2 但:样本的标准差的数学期望不等于总体标准差 E(S)如果要化成相等,则必须乘以一个常数C4(统计学上 称为标准差分布的矩系数)。C4称为称为分布,读作珈玛分布。Xr-1 e-x d x=1 C4=0 r(r)(n/2)(n-1)/2 (n-1)/2C5 1-(c4)2当n大于100时,C4接近于1。因此,当n大于100时,样本标准差也是总体标准差的 无偏估计量。所以,样本的无偏估计量有三个:X 是 的无偏估计量。S 2 是 2 的无偏估计量。S 是 (n100)时无偏估计量。2、有效估计量:(efficient estimator)S2X=S2/n S2
3、m=S2/2n 平均数的方差 中位数的方差 中位数的方差比平均数的方差大/2 倍。所以,用样本平均数去估计总体平均数比用中位数去估计总体平均数更为有效。3、一致估计量:(consistent estimtor)S2X=S2/n 随着n的无限增加,S2X愈来愈小,当n 时,S2X 0.这时:X=所以,样本平均数是总体平均数的一致估计量。样本方差是总体方差的一致估计量。综上所述:X 无偏 有效 S2 2 一致最佳估计量二、区间估计:interval estimate 我们已知,标准的正态分布是当平均数为0,标准差为1时的正态分布。记作:N(0,1).并强调要记住几个特殊的数据:L1L2X-1.96
4、X+1.96X-1X+1X 面积为68.27。-2X+2X 面积为95.43。-3X+3X 面积为99.73。-1.96X+1.96X 面积为95。(显著标准)-2.576X+2.576X面积为99。(极显著标准)由于我们在进行统计分析时,是把一个样本作为总体来假设的,所以这个平均数可相信的程度即反映了总体平均数可相信的程度,数学上称它为“置信区间”。以这个被置信的平均数为中点,来估计它的最大或最小的变异幅度,称为置信上限和置信下限。L1-置信下限 L2-置信上限 因此,有了这个置信区间,我们就能从样本推断总体,从样本平均数推断总体平均数所置于的分布区间。1、正态分布置信区间:X1X P=68
5、.26%X2X P=95.45%X3X P=99.73%而我们统计学上要求的两个标准是:P为:0.05(5)即:95可信 P为:0.01(1)即:99可信折合区间为:P=0.95 X1.96X P=0.99 X2.576X因此,则有:P(-1.96X)X(+1.96X)解不等式:(-1.96X)X(+1.96X)各项减:-1.96X(X-)+1.96X各项减X:-X-1.96X-X+1.96X各项乘以-1:(X+1.96X)(X-1.96X)所以:P(X-1.96X)(X+1.96X)=0.95表明:对理论平均数()95%的置信区间(可信范围)是:(X-1.96X)(X+1.96X)置信上限:
6、L1=X-1.96X置信下限:L2=X+1.96X同理:P(X-2.576X)(X+2.576X)=0.99表明:对理论平均数95的置信区间(可信范围)是:X-2.576X X+2.576X置信下限L1=X-2.576X 置信上限L2=X+2.576X由于:1.96,2.576是Ua值,故:正态分布的置信区间的公式是:(X-Ua X)(X+Ua X)置信下限L1=X-UaX 置信上限L2=X+UaX例:36名男子静息时,耗氧量X=185.7CC/M3/分钟,若 已知成年男子静息时的耗氧量的平均数的标准差为:X5.1CC/M3/分钟,求95置信度下,成年男子静 息时的耗氧量的置信区间:解:置信度
7、:P=1-a=0.95 a=0.05查表得:U0.05(双侧)1.96代入公式:(X-1.96X)(X+1.96X)(185.7-1.965.1)(185.7+1.965.1)175.704195.696表明:有95的把握可以说成年男子静息时的耗氧量在 175.704CC/M3/分钟195.696CC/M3/分钟。2、t分布置信区间:(未知)当样本n 30,t分布接近正态分布。当样本n 大,t分布于正态分布完全相同。所以:同样有:(X-taX)(X+taX)置信下限L1=X-taX 置信上限L2=X+taX例:上例若改成:不知成年男子静息时的标准误,而只统计了36名成年男子静息时的耗氧量:X=
8、185.7,SX=5.1.代入公式:(X-taX)(X+taX)查表:df36-135 t0.052.042 (185.7-2.0425.1)(185.7+2.0425.1)175.3196.1。3、两样本平均数差数的正态分布置信区间:(总体已知)同理可以推导:(X1-X2)UaX1-X2)(1-2)(X 1-X2)+UaX1-X2)L1=(X1-X2)-UaX1-X2 L2=(X1-X2)+UaX1-X2式中:(X1-X2)-平均数差数(d)SX1-X2-平均数差数的标准差(标准误)S12 S22 n1 +n24、两样本平均数差数的t分布置信区间:(总体未知)(X1-X2)t aX1-X2)
9、(1-2)(X 1-X2)+t aX1-X2)L1=(X1-X2)-taX1-X2 L2=(X1-X2)+taX1-X25、配对数据的t分布置信区间:同样有:(dt a S d)U d(d+t a S d)L1=dt a S d L2=d+t a S d S d S d=n6、二项分布的置信区间:当n 大时,二项分布接近正态分布。同样有:(P-U a SP)UP(P+U a SP)L1=P-U a SP L2=P+U a SP式中:P=样本百分数X/n P(1-P)SP=n例:某医院电针治疗58例关节炎病人,其有效率为:70.6 求:95置信度下的有效率的置信区间。解:P=70.6%n=58 x=P n=70.65840.95查表:x40(表中用f表示)n50(查表取小值)得:66,90表明:电针治疗关节炎,其有效率95的置信区间是:66P90%如果不用二项分布区间估计,二采用正态分布区间估计,则:L1=P-U a S P=70.6%-1.960.0658.84 L2=P+U a S P=70.6%+1.960.0682.3695的置信区间是:58.84P82.36%7、区间估计与显著性检验的关系:1)、可以相互验证。2)、可以互补。
限制150内