欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    总体均数的估计和两均数的假设检验.ppt

    • 资源ID:91066523       资源大小:2.50MB        全文页数:137页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    总体均数的估计和两均数的假设检验.ppt

    数值变量统计分析数值变量统计分析 集中趋势和离散趋势的集中趋势和离散趋势的描述描述 统计统计推断推断 均数的抽样误差及均数的抽样误差及t t分分布的特点布的特点 总体均数的估计总体均数的估计 假设检验假设检验 第十六章第十六章 总体均数的估计和两均数总体均数的估计和两均数的假设检验的假设检验复习几个概念:复习几个概念:计量资料:计量资料:测定每个观察单位某项指标量的大小得到的数 据(资料)。总体:总体:研究对象(某项变量值)的全体。样本:样本:总体中随机抽取的一部分研究对象的某项变量值。统计量:统计量:从样本计算出来的统计指标。参数:参数:总体的统计指标叫总体参数。统计推断:统计推断:用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出来的统计指标量,运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。对总体统计指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的差别对样本又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。所代表的总体间是否存在着差别做出判断。总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P内容:内容:1.参数估计参数估计(estimation of parameters)2.包括:点估包括:点估计与区间估计计与区间估计3.2.假设检验假设检验(test of hypothesis)主要内容第一节第一节均数的抽样误差与标准误均数的抽样误差与标准误第二节第二节t 值与值与t分布分布第三节第三节总体均数的估计总体均数的估计第四节第四节假设检验的一般步骤假设检验的一般步骤第五节第五节样本均数与总体均数的比较样本均数与总体均数的比较样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 统计推断统计推断第一节第一节样本均数的标准误样本均数的标准误如:如:样本均数样本均数 样本标准差样本标准差S 样本率样本率 P总体总体参参参参 数数数数 如:如:总体均数总体均数 总体标准差总体标准差 总体率总体率 正态(分布)总体:正态(分布)总体:推断推断!部分部分=总体总体?抽样误差抽样误差 (sampling sampling error)error):由:由于个体差异导于个体差异导致的致的样本样本统计统计量与量与总体总体参数参数间的差别。间的差别。第一节第一节 标准误标准误一、概念一、概念抽样误差:抽样误差:由于抽样引起的样本统计量与总体参数之间的由于抽样引起的样本统计量与总体参数之间的差异(举例,抽样误差的产生及含义)。差异(举例,抽样误差的产生及含义)。标准误标准误:符号,表示抽样误差大小的指标;符号,表示抽样误差大小的指标;样本均数的标准差;样本均数的标准差;一、抽样研究与抽样误差一、抽样研究与抽样误差 抽样研究的目的是要用样本信息推断总体特征,称统计推断统计推断。1 1、抽样研究抽样研究:从总体中随机抽取一定数量的观察单位组或样本,对其进行研究,以此来推断总体的情况。如从某地8岁的男孩中,随机抽取200人,分别测量其身高,计算样本均数,用来估计该地8岁男孩身高的总体均数就属于抽样研究。2、均数的抽样误差均数的抽样误差(sampling error):是指由抽样造成的样本均数与总体均数之差 。如如要要了了解解某某地地成成年年男男子子红红细细胞胞数数的的总总体体均均数数,抽抽得得144个个样样本本,求求出出样样本本均均数数 =5.381012/L,估估计计该该地地成成年年男男子子红红细细胞胞数数的的总总体体均均数数,由由于于抽抽样样误误差差,-称均数的抽样误差。称均数的抽样误差。二、标准误概念:均数的标准误,简称标标准准误误(standarderror,SE):说明均数抽样误差大小的指标。即由样本均数估计总体均数可靠性大小的指标。X 1S1X 2 S2 X ISiX nSnx标准误示意图标准误示意图表表示示样样本本统统计计量量抽抽样样误误差差大大小小的的统统计计指标。指标。均均数数标标准准误误:说说明明均均数数抽抽样样误误差差的的大小,总体计算公式大小,总体计算公式(3-1)2、标准误标准误(standard error,SE)实质:样本均数的标准差实质:样本均数的标准差若用样本标准差若用样本标准差S 来估计来估计,(3-2)降低抽样误差的途径有降低抽样误差的途径有:通过增加样本含量通过增加样本含量n;通过设计减少通过设计减少S标准误标准误标准误标准误 标准误 标准误 标准误 4.标准误与标准差的比较三、三、(均数)标准误(均数)标准误意义:意义:反映抽样误差的大小。标准误越小,抽样反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越误差越小,用样本均数估计总体均数的可靠性越大。大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准误,标准误二、(均数)标准误的计算二、(均数)标准误的计算第二节 t 分布l复习两个概念:正态分布 标准正态分布(u 分布)大样本、小样本概念:大样本、小样本概念:30、50、100。量变引起质变:当样本容量较大时,其统计量的抽量变引起质变:当样本容量较大时,其统计量的抽样分布近似为正态分布。随着样分布近似为正态分布。随着N的增大,越来越接近的增大,越来越接近于正态分布(样本均数的分布)。于正态分布(样本均数的分布)。但当样本量小于但当样本量小于100时,抽样分布不能再用正态分布时,抽样分布不能再用正态分布来近似,随着来近似,随着N的减小,与正态分布的差别越来越大,的减小,与正态分布的差别越来越大,需要用小样本理论来解释(样本均数的分布)需要用小样本理论来解释(样本均数的分布)。一、一、t t分布分布随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1均数均数正态分布正态分布t 分布(与分布(与u分布比较的特点)分布比较的特点)t 值表值表(附表(附表2P367)横坐标:自由度,横坐标:自由度,纵坐标:概率,纵坐标:概率,P,即曲线下阴影部分的面积即曲线下阴影部分的面积;表中的数字:相应的表中的数字:相应的|t|界值。界值。t 值表规律:值表规律:(1)自由度(自由度()一定时,)一定时,P与与t 成反比成反比;(2)概率(概率(P)一定时,一定时,与与t 成反比成反比;第二节 t 值与 t 分布 l一、t值 t值为样本均数与总体均数相差多少个标准误二、t分布从同一总体中抽取许多大小相同的样本,可得到许多 及s,代入(163),就可以得到许多的t值,将这些t值绘成直方图,当样本无限多时,就绘成一条光滑的曲线,这就是 t 分布曲线。这种t值的分布就叫 t 分布 二、t分布l特征l:lt界值表将不同自由度将不同自由度,不同概率,不同概率P(从正态总体作随机抽样得样本(从正态总体作随机抽样得样本t值值落在该区间的概率)(即检验水准落在该区间的概率)(即检验水准)的)的t值列成表格称值列成表格称t界值表界值表t 分布 lt分布左右两端尾部面积之和=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,这里是自由度。l把左右两端尾部面积之和为0.01相应的t值称为1%界,符号为t0.01,。lt的5%界与1%界可查附表5 t值表。l例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。t t分布曲线下面积(附表分布曲线下面积(附表2 2)双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64ut双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64ut0-11-1.961.96-2.582.5868.27%95.00%99.00%ut 分布-tt0举例举例:小结l标准正态分布l当0,1,使原来的正态分布变换为标准正态分布,亦称u分布区间的面积分别区间的面积分别占总面积的占总面积的68.271.96 为为952.58为为 99。|u|1.96的面积为0.05正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下面积的分布规律小结l t 分布:t分布把t分布左右两端尾部面积之和=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,把左右两端尾部面积之和为0.01相应的t值称为1%界,符号为t0.01,三总体均数的参数估计三总体均数的参数估计统计推断统计推断假设检验假设检验 参数估计参数估计 参数估计就是用样本指标(即统计量)来估计总体指标(即参数)点值估计点值估计 区间估计区间估计 总体均数的估计总体均数的估计统计推断的任务就是用样本信息推论总统计推断的任务就是用样本信息推论总体特征。体特征。参数估计,参数估计,用样本均数估计总体均数。用样本均数估计总体均数。1、点(值)估计(近似值)点(值)估计(近似值)2、区间估计(近似范围)区间估计(近似范围)1、点点(值值)估计:估计:用样本均数直接作为总体均数的估计值,用样本均数直接作为总体均数的估计值,未考虑抽样未考虑抽样误差。误差。总体均数的点值估计总体均数的点值估计点值估计点值估计 就是以某一样本均数来作总体均数的估计 如随机抽查140例成年男子,测得红细胞的均值为4.791012/L,以此值作为某地成年男子的总体均数的估计值,叫“点值估计”。点值估计比较方便、简单。但由于存在抽样误差,不同的样本可能得到不同的估计值,所以其准确度较低。2、区间估计、区间估计概念概念:根据样本均数,按一定的根据样本均数,按一定的可信度可信度计算计算出总体均数很可能在的一个出总体均数很可能在的一个数值范围数值范围,这个,这个范围称为总体均数的可信区间。范围称为总体均数的可信区间。方法:方法:(1)u分布分布法法(2)t分布法分布法(1)u分布分布法法公式公式应用条件应用条件:例题例题意义:与正常值范围进行比较意义:与正常值范围进行比较(xus x,xu s x)即(xus x)样本量较大,已知或可计算出 x 及 Sx换句话说,做出该市成人脉搏均数为换句话说,做出该市成人脉搏均数为73.9次次/分分75.1次次/分的结论,说对的概率是分的结论,说对的概率是95%,说错的,说错的概率是概率是5%;做出该市成人脉搏均数为;做出该市成人脉搏均数为73.7次次/分分75.3次次/分的结论,说对的概率是分的结论,说对的概率是99%,说错的概率,说错的概率是是1%。意义:意义:虽然不能知道某市全体成人脉搏均数的确切数虽然不能知道某市全体成人脉搏均数的确切数值,但有值,但有95%的把握说该市全体成人脉搏均数在的把握说该市全体成人脉搏均数在73.9次次/分分75.1次次/分之间,有分之间,有99%的把握说该市全体成的把握说该市全体成人脉搏均数在人脉搏均数在73.7次次/分分75.3次次/分之间。分之间。换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错,说错的概率是的概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7164.7cm的结论,说对的概率是的结论,说对的概率是99%,说错的概率,说错的概率是是1%。意义:意义:虽然不能知道某校全体女大学生身高均数的确虽然不能知道某校全体女大学生身高均数的确切数值,但有切数值,但有95%的把握说校全体女大学生身高均数的把握说校全体女大学生身高均数在在163.0164.5cm之间,有之间,有99%的把握说校全体女的把握说校全体女大学生身高均数在大学生身高均数在162.7164.7cm之间。之间。(2)t分布分布法法公式公式应用条件应用条件例题例题意义意义(x ts x,xt s x)即(xts x)样本量 较小,已知或可计算出 X 及s x二、总体均数的区间估计二、总体均数的区间估计区区间间估估计计(intervalestimation)是是按按一一定定的的概概率率来来估计总体均数在哪个范围。估计总体均数在哪个范围。预先给定的概率称为可可信信度度,符号为1,常取95%或99%;按此确定的可信区间分别称为95%或99%可信区间。意思是说,从被估计的总体中随机抽取若干个含量为 n 的样本,由每个样本计算出一个95%可信区间,理论上,其中有95%的可信区间将包含被估计的总体均数。以样本对95%可信区间作估计时,被估计的总体均数不在该区间的概率是很小的,仅5%。(一一)总体均数可信区间的计算总体均数可信区间的计算(一一)总体均数可信区间的计算总体均数可信区间的计算t0.05,9=2.262,t0.01,9=3.250,(一一)总体均数可信区间的计算总体均数可信区间的计算(一一)总体均数可信区间的计算总体均数可信区间的计算(一一)总体均数可信区间的计算总体均数可信区间的计算(2)已知已知(3)未知,但未知,但n足够大足够大n100 例例3-3某地抽取正常成年人某地抽取正常成年人200名,测得名,测得其血清胆固醇的均数为其血清胆固醇的均数为3.64mmol/L,标准差,标准差为为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数的固醇均数的95%可信区间。可信区间。故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧侧95%可信区间为可信区间为(3.47,3.81)mmol L。100可信区间的解释可信区间的解释 9595可信区间可信区间:从总体中作随机抽样,作:从总体中作随机抽样,作100100次抽样,每个样本可算得一个可信区间,次抽样,每个样本可算得一个可信区间,得得100100个可信区间,平均有个可信区间,平均有9595个可信区间包个可信区间包括括(估计正确估计正确),只有,只有5 5个可信区间不包括个可信区间不包括(估计错误估计错误)。9595可信区间可信区间 99 99可信区间可信区间 公式公式 区间范围区间范围 窄窄 宽宽 估计错误的概率估计错误的概率 大(大(0.050.05)小(小(0.010.01)区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小,用用(1-)来衡量。来衡量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n,S一定时)一定时)。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范围越指区间范围的宽窄,范围越宽精确度越差。宽精确度越差。99%的可信区间的可信区间差于差于95%的可信区间的可信区间(n,S一定时)一定时)。准确度与精确度的关系:准确度与精确度的关系:(例如预测孩子的身高)(例如预测孩子的身高)(三)可信区间与可信限的关系(三)可信区间与可信限的关系 正常值范围正常值范围概念:概念:绝大多数正常人的某指绝大多数正常人的某指标范围。(标范围。(95%,99%,指绝大指绝大多数正常人)多数正常人)计算公式:计算公式:用途:判断观察对象的某用途:判断观察对象的某项指标是否正常项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所在的数值范围(范围(95%,99%指可信度)指可信度)计算公式:计算公式:用途:估计总体均数用途:估计总体均数正常值范围估计与可信区间估计正常值范围估计与可信区间估计第四节第四节 假设检验假设检验显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必是由于碰巧?还是由于必然的原因?统计学家运用然的原因?统计学家运用显著性检验来处理这类问显著性检验来处理这类问题。题。假设检验:假设检验:1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果1、假设检验的原因、假设检验的原因由于个体差异的存在,即使从同一总体中由于个体差异的存在,即使从同一总体中严格的随机抽样,严格的随机抽样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性成了样本均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。2、假设检验的目的、假设检验的目的 3、假设检验的原理、假设检验的原理/思想思想反证法反证法:当一件事情的发生只有两种可能:当一件事情的发生只有两种可能A和和B,为了肯定其,为了肯定其中的一种情况中的一种情况A,但又不能直接证实,但又不能直接证实A,这时否定另一种可能,这时否定另一种可能B,则间接的肯定了,则间接的肯定了A。概率论概率论(小概率)(小概率):如果一件事情发生的概率很小,那么在:如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是进行一次试验时,我们说这个事件是“不会发生的不会发生的”。从一般的。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。误的时候,因为概率再小也是有可能发生的。l判断是由于何种原因造成的不同,以做出决策。假设检验的基本思想小概率反证法 在一次研究观察中,如果出现了假设成立情况下的小概率事件,由于推理过程是严密的,就只能认为假设不成立,应予拒绝或否定,并接受它的对立面。假设推导小概率事件否定假设检验 例 3.4 据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?两均数不相等的原因有两种可能:由于抽样误差所致;样本来自另一总体(由于环境条件的影响,山区成年男子的脉搏确实高于一般)。判断的方法:假设检验已知总体72次/分 样本未知总体?4、假设检验的一般步骤、假设检验的一般步骤建立假设(反证法):建立假设(反证法):确定显著性水平(确定显著性水平():):计算统计量:计算统计量:u,t,2确定概率值:确定概率值:做出推论做出推论1.建立检验假设,确定检验水准假设有两种:一是无效假设(null hypothesis)或称零假设,用H0示之;二是备择假设(alternative hypothesis),用H1示之。H0和H1都是根据统计推断的目的提出的对总体特征的假设,是相互联系且对立的一对假设。1.建立检验假设,确定检验水准建立假设前,先要根据分析目的和专业知识明确单侧检验还是双侧检验。(例)样本均数(其总体均数为)与已知总体均数0的比较 目的 H0 H1双侧检验是否0 =0 0单侧检验是否0 =0 0 或是否0 =0 时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。尚不能认为第四节第四节 假设检验的一般步骤假设检验的一般步骤 5、假设检验的结果、假设检验的结果l接受检验假设检验假设l拒绝拒绝检验假设检验假设正确理解结论的概率性(都隐含着犯错误的正确理解结论的概率性(都隐含着犯错误的可能性)。可能性)。两均数的假设检验l一、单样本一、单样本t检验检验样本均数与总体均数的样本均数与总体均数的比较比较 l二、配对二、配对t 检验检验成对资料均数的成对资料均数的t检验检验 l三、两样本三、两样本t检验检验成组资料两样本均数的比较成组资料两样本均数的比较 l方差不齐时两小样本均数的比较方差不齐时两小样本均数的比较 一、单样本一、单样本 t 检验检验(一)大样本(一)大样本 一般女性平均身高160.1 cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80cm。请问某大学18岁女大学生身高是否与一般女性不同。目的:目的:比较样本均数所代表的未知总体均数比较样本均数所代表的未知总体均数与已知的总体均数有无差别与已知的总体均数有无差别计算公式:计算公式:u统计量统计量=适用条件:适用条件:(1)已知一个总体均数;已知一个总体均数;(2)可得到一个样本均数;可得到一个样本均数;(3)可得到该样本标准误;可得到该样本标准误;(4)样本量不小于样本量不小于100。例题:例题:(1)一个总体均数:一个总体均数:160.1cm;(2)一个样本均数:一个样本均数:163.74cm;(3)可计算出样本标准误可计算出样本标准误(4)n=100;假设检验:假设检验:建立假设:建立假设:检验假设检验假设:某校女大学生身高均数与一般女子身高某校女大学生身高均数与一般女子身高均数相同;均数相同;H0:=0;备择假设备择假设:某校女大学生身高均数与一般女子身高某校女大学生身高均数与一般女子身高均数不同;均数不同;H1:0确定显著性水平(确定显著性水平():):0.05做出推论做出推论:U=9.581.96,p0.05=,小概率事件发生了,小概率事件发生了,原假设不成立;拒绝原假设不成立;拒绝H0,接受接受H1,可认为:可认为:某校女某校女大学生身高均数与一般女子身高均数不同大学生身高均数与一般女子身高均数不同;某校女某校女大学生身高均数与一般女子身高均数大学生身高均数与一般女子身高均数差别有显著性。差别有显著性。计算统计量:计算统计量:计算统计量:计算统计量:uu统计量:统计量:统计量:统计量:u=u=确定概率值:确定概率值:|u|=9.58u=1.96uu p=0.05;(二)小样本(二)小样本已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果均数为65.63次/分,标准差为7.2次/分。目的:目的:比较一个小样本均数所代表的未知总比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。体均数与已知的总体均数有无差别。计算公式:计算公式:t统计量:统计量:t=自由度:自由度:=n-1适用条件:适用条件:(1)已知一个总体均数;已知一个总体均数;(2)可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3)样本量样本量小于小于100;(4)样本来自正态或近似正态总体。样本来自正态或近似正态总体。例题:例题:已知:已知:(1)一个总体均数:一个总体均数:74次次/分分;(2)一个样本均数:一个样本均数:65.63次次/分分;(3)可计算出样本标准误可计算出样本标准误(4)n=16t0.05(25),p0.05做出推论做出推论:p0.05 t 0.05(9)p 0.05.判断结果:因为p 0.05,故拒绝检验假设H0,10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。二、配对二、配对t 检验检验单侧检验10二、配对二、配对t 检验检验二、配对二、配对t 检验检验二、配对二、配对t 检验检验 例例3-6为为比比较较两两种种方方法法对对乳乳酸酸饮饮料料中中脂脂肪肪含含量量测测定定结结果果是是否否不不同同,某某人人随随机机抽抽取取了了10份份乳乳酸酸饮饮料料制制品品,分分别别用用脂脂肪肪酸酸水水解解法法和和哥哥特特里里罗罗紫紫法法测测定定其其结结果果如如表表3-3第第(1)(3)栏栏。问问两两法法测定结果是否不同?测定结果是否不同?表表3-3两种方法对乳酸饮料中脂肪含量的测定结果两种方法对乳酸饮料中脂肪含量的测定结果(%)(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:d0,即两种方法的测定结果相同,即两种方法的测定结果相同H1:d0,即两种方法的测定结果不同,即两种方法的测定结果不同=0.05(2)计算检验统计量计算检验统计量本例本例n=10,d=2.724,d2=0.8483,按公式按公式(3-16)(3)确定确定P值,作出推断结论值,作出推断结论查查附附表表2的的t界界值值表表得得P0.001。按按=0.05水水准准,拒拒绝绝H0,接接受受H1,有有统统计计学学意意义义。可可认认为为两两种种方方法法对对脂脂肪肪含含量量的的测测定定结结果果不不同同,哥哥特里罗紫法测定结果较高特里罗紫法测定结果较高。三、两样本三、两样本t检验检验l例题:l为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本所代表的总体均数间有无差别。所代表的总体均数间有无差别。计算公式及意义:计算公式及意义:t统计量统计量:t=自由度自由度=n1+n22适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差;(2)两个样本之一的例数少于)两个样本之一的例数少于100;第七节第七节 成组资料两样本均数成组资料两样本均数的比较的比较一、成组资料两样本均数比较的一、成组资料两样本均数比较的t检验检验=n1+n2-2t例题:例题:已知:已知:(1)一个样本一个样本:均数均数48.25,标准差标准差32.0;(2)另一个样本另一个样本:均数均数36.37,标准差标准差27.65;(2)n1=20;n2=19假设检验:假设检验:建立假设:建立假设:检验假设检验假设:两组药疗效相同;两组药疗效相同;备择假设备择假设:两组药疗效不同不同;两组药疗效不同不同;确定显著性水平(确定显著性水平():):0.05计算统计量:计算统计量:t统计量:统计量:t=1.238;自由度:自由度:20+192=37表中:表中:t0.05(37)=2.026确定概率值:确定概率值:t0.05;做出推论做出推论:因为因为p0.05,不能拒绝不能拒绝H0:认为认为两组药疗效相同。可以用国产药代替进口药两组药疗效相同。可以用国产药代替进口药。例例3-7为为研研究究国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊的的降降血血糖糖效效果果,某某医医院院用用40名名II型型糖糖尿尿病病病病人人进进行行同同期期随随机机对对照照试试验验。试试验验者者将将这这些些病病人人随随机机等等分分到到试试验验组组(用用阿阿卡卡波波糖糖胶胶囊囊)和和对对照照组组(用用拜拜唐唐苹苹胶胶囊囊),分分别别测测得得试试验验开开始始前前和和8周周后后的的空空腹腹血血糖糖,算算得得空空腹腹血血糖糖下下降降值值见见表表3-4,能能否否认认为为该该国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊与与拜拜唐唐苹苹胶胶囊囊对对空空腹腹血血糖糖的的降降糖糖效效果不同?果不同?(2)计算检验统计量计算检验统计量(3)确定确定P值,作出推断结论值,作出推断结论l一、两个方差的齐性检验一、两个方差的齐性检验3.确定P值,作出统计推断 1=n1-1,2=n2-1,查附表方差齐性检验用的F分布表,如果,即P,因此拒绝H0,接受H1。认为两个总体的方差不等。否则不拒绝H0,认为两个总体的方差相等。成组资料的方差齐性检验(一)两个方差的齐性检验(一)两个方差的齐性检验(二)(二)t检验检验 调整 t 界值 例例3-8在在上上述述例例3-7国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊的的降降血血糖糖效效果果研研究究中中,测测得得用用拜拜唐唐苹苹胶胶囊囊的的对对照照组组20例例病病人人和和用用阿阿卡卡波波糖糖胶胶囊囊的的试试验验组组20例例病病人人,其其8周周时时糖糖化化血血红红蛋蛋白白HbA1c(%)下下降降值值如如表表3-5。问问用用两两种种不不同同药药物物的的病病人人其其HbA1c下下降降值是否不同?值是否不同?表3-5 对照组和试验组HbA1c下降值(%)对对照照组组方方差差是是试试验验组组方方差差的的3.77倍倍,经经方方差差齐齐性性检检验,认为两组的总体方差不等,故采用验,认为两组的总体方差不等,故采用近似近似t 检验检验。(1)建立检验假设,确定检验水准建立检验假设,确定检验水准(略略)(2)计算检验统计量计算检验统计量(3)确定确定P值,作出推断结论。值,作出推断结论。查查t界值表界值表t0.05/2,19=2.093。由由 t=0.9650.05。按按=0.05水水准准,不不拒拒绝绝H0,无无统统计计学学意意义义。还还不不能能认认为为用用两两种种不不同同药药物物的的病病人人其其HbA1c下下降降值值不同。不同。第第九九节节均数假设检验的注意事项均数假设检验的注意事项1、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:(1)当 p ,不能拒绝不能拒绝H0,不能接受不能接受H1,按不能按不能接受接受H1下结论,也可能犯错误;下结论,也可能犯错误;J(1)当拒绝拒绝H0时时,可能犯错误,可能可能犯错误,可能拒绝了实际拒绝了实际上成立的上成立的H0,称为称为类类错误错误(“弃真弃真”的错误的错误),),其概率大小用其概率大小用 表示表示。J(2)当)当不能拒绝不能拒绝H0时,也可能犯错误,时,也可能犯错误,没有没有拒拒绝实际绝实际上不成立的上不成立的H0,这类这类称称为为II类类错误错误(”存存伪伪”的的错误错误),其概率大小用其概率大小用 表示表示,值值一般一般不能确切的知道不能确切的知道。2 2、第、第、第、第 I I 类错误和第类错误和第类错误和第类错误和第 II II 类错误类错误类错误类错误假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1.当样本量一定时当样本量一定时,愈小愈小,则则 愈大愈大,反之反之;2.2.当当 一定时一定时,样本量增加样本量增加,减少减少.3.统计学中的差异显著或不显著,和日常生统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同活中所说的差异大小概念不同.(不仅区别于均(不仅区别于均数差异的大小,还区别于均数变异的大小数差异的大小,还区别于均数变异的大小)4、其它注意事项、其它注意事项选择假设检验方法要注意符合其应用条件;选择假设检验方法要注意符合其应用条件;当不能拒绝当不能拒绝H0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑的因素:可能是样本例数不够;的因素:可能是样本例数不够;单侧检验与双侧检验的问题单侧检验与双侧检验的问题第十节第十节 可信区间与假设检验的联系与区别可信区间与假设检验的联系与区别1.可信区间也可以回答假设检验的问题可信区间也可以回答假设检验的问题2.可可信信区区间间比比假假设设检检验验可可提提供供更更多多的的信信息息有关假设检验公式l1.样本均数与总体均数的比较样本均数与总体均数的比较 正态分布的资料,大样本或样本虽小但总体标准差已知时 未知的小样本正态分布资料 2.成对资料均数的成对资料均数的t检验检验 有关假设检验公式l成组资料两样本均数的比较成组资料两样本均数的比较 l =l l两大样本均数两大样本均数两大样本均数两大样本均数有关假设检验公式l两个方差的齐性检验两个方差的齐性检验:F=12/22 1.均数的标准误与标准差的区别均数的标准误与标准差的区别2 2、t t分布概念和性质分布概念和性质随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1均数均数正态分布正态分布t t分布曲线分布曲线 t t 分布分布有如下性质:有如下性质:单峰分布,曲线在单峰分布,曲线在t t0 0 处最高,并以处最高,并以t t0 0为中心为中心左右对称左右对称与正态分布相比,曲线与正态分布相比,曲线最高处较矮,两最高处较矮,两尾部翘得尾部翘得高高(见绿线)(见绿线)随自由度增大,曲线逐随自由度增大,曲线逐渐接近正态分布;分布的渐接近正态分布;分布的极限为标准正态分布。极限为标准正态分布。3、参数估计和假设检验l可信区间的解释可信区间的解释 9595可信区间可信区间:从总体中作随机抽样,作:从总体中作随机抽样,作100100次抽样,每个样本可算得一个可信区间,次抽样,每个样本可算得一个可信区间,得得100100个可信区间,平均有个可信区间,平均有9595个可信区间包个可信区间包括括(估计正确估计正确),只有,只有5 5个可信区间不包括个可信区间不包括(估计错误估计错误)。4.两均数差别检验的比较:两均数差别检验的比较:大样本也可近似用u检验THANK YOU!您您的的建建议议是是我我进进步步的的源源泉泉!

    注意事项

    本文(总体均数的估计和两均数的假设检验.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开