欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    基本分布.ppt

    • 资源ID:67182915       资源大小:799.50KB        全文页数:69页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基本分布.ppt

    第五章 基本分布 Oct 20,2009第一节第一节 随机变量及其分布随机变量及其分布一、随机变量(一、随机变量(random variable)n 随机现象,也称不确定现象,指在相同条件下重复试验可 得到不同结果的现象。n 必然现象,也称确定性现象 n 随机试验所得到的每一种可能的结果称为 随机事件。数学上可用一个变量,如X来描 述,称为随机变量。n 随机变量的每一取值一般都有确定的概率,如P(治愈)=P(X=1)=0.60等。因此每一随机变量 都有一定的概率分布,其分布的类型有两种,即离散型分布和连续型分布。Oct 20,20091 1、离散型随机变量、离散型随机变量 (discrete(discrete random variable)random variable)随机变量X只能取有限个数值X1,X2,Xn或无限个可数数值X1,X2,Xn,则X定义为离散型随机变量。当X=Xk ,概率为P(Xk)则有随机变量的概率分布 Oct 20,2009离散型随机变量的分布函数:Oct 20,20092 2、连续型随机变量、连续型随机变量 (continuous(continuous random variable)random variable)像某地某年正常成年男子身高这样的随机变量,由于其可能取值不能一一列举出来,而是在实数轴上的某一确定区间内连续分布,称之为连续分布型随机变量,简称连续型随机变量。随机变量X的分布函数F(x)为:概率密度函数 f(x):表示随机变量X在取值X附近单位长度内的概率的大小。为分布函数F(x)的导数。所以,对于连续型随机变量来说,要掌握其概率分布规律,其关键是求出其概率密度函数。Oct 20,2009第二节第二节 正态分布正态分布Oct 20,2009正态分布曲线的演变正态分布曲线的演变 频率5-2 a1251291331371411451491531571610.1.2.3.4身高(cm)5-2 bOct 20,2009这条曲线称为频率曲线,略呈钟型,两侧低,中间高,左右对称,近似于概率分布中的正态分布。频率的总和为1,故正态分布曲线下横轴上的面积也应为1。正态分布的概率密度函数,也称为正态分布曲线方程为:Oct 20,2009正态分布的特性 正态分布只有一个峰值,位于x=处正态分布以x=对称轴左右对称正态分布的两个参数 和 决定分布位置和形状 正态分布曲线下面积分布有规律 Oct 20,2009Oct 20,2009对于正态分布常用 xN(,)Oct 20,2009Oct 20,2009标准正态分布标准正态分布与标准化变换:(,)v标准化变换:v令=0,=1v标准正态分布:(0,1)Oct 20,2009Oct 20,2009Oct 20,2009标准正态分布的应用标准正态分布的应用例53 已知某地2003年120名7岁男童身高 =122.0cm,s=4.7cm,试估计该地7岁男童身高介于118cm和124cm范围内的比例及110名7岁男童介于此范围内的人数。Oct 20,2009Oct 20,2009 D=0.6646-0.1989=0.4657=46.57%(u1)=(-0.8511)=0.1989(u2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646 Oct 20,2009三、参考值范围定义:绝大多数正常人的解剖,生理,生化各种指标的波动范围,称作为医学参考值范围(medical reference ranges)。正常人:并非指机体任何器官、组织的形态和机能都正常的人,而是指排除了影响所研究指标的疾病和有关因素的人 Oct 20,2009步骤和原则步骤和原则抽取足够大例数的正常人作为样本(n=100)控制测量误差 确定是否需要分组确定参考值范围 决定取双侧还是取单侧 选定合适的百分界限 两种方法:正态分布法和百分位数法Oct 20,2009正态分布法正态分布法当资料符合正态分布时双侧1正常值范围公式为:单侧上限1正常值范围公式为:Oct 20,2009u u界值的概念界值的概念 u/2 为标准正态分布下双侧尾部面积为时的u值(绝对值)u2为标准正态分布下单侧尾部面积为时的u值(绝对值)特别地:u0.05/21.96;u0.01/22.58;u0.05 1.64;u0.01 2.33;Oct 20,2009Oct 20,2009Oct 20,2009百分位数法百分位数法用于任何分布的资料(n150)。当资料为偏态分布时,不能用正态分布法,而用百分位数法得到1 正常值范围双侧1正常值范围:P100/2 P 100(1-/2)单侧1正常值范围上限:P 100Oct 20,2009Oct 20,2009Oct 20,2009第三节第三节 t t分布分布一、抽样误差和样本均数分布一、抽样误差和样本均数分布n抽样误差由于抽样引起的总体参数与样本统计量之间的差异叫抽样误差。总体均数与样本均数之间的差异叫均数抽样误差。Oct 20,2009样本均数分布和抽样误差大小的估计样本均数分布和抽样误差大小的估计Oct 20,2009抽样试验抽样试验某市1999年18岁男生身高服从均数=167.7cm,=5.3cm的正态分布;从XN(167.7,5.32)的正态总体中随机抽样,样本含量nj=10,g=100;共抽100次;Oct 20,2009图图3.1 19993.1 1999年某市年某市1818岁男生身高岁男生身高 N(167.7,5.3N(167.7,5.32 2)的抽样示意的抽样示意=167.7cm=5.3cmX1,X2,X3Xj,167.41,2.74165.56,6.57 168.20,5.36 :165.69,5.09100个个Oct 20,2009样本均数组成一个新的分布特点样本均数组成一个新的分布特点各样本均数未必等于总体均数;各样本均数未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布很有规律;样本均数的分布很有规律;u ,100个样本均数的均数为个样本均数的均数为167.69cm,而原总体均数为而原总体均数为167.7cm u样本均数的变异范围较原变量的变异范围大大缩小;样本均数的变异范围较原变量的变异范围大大缩小;标准差为标准差为1.69(5.3);Oct 20,2009中心极限定理若若 服从正态分布,则服从正态分布,则 服从正态分布;服从正态分布;若若 不服从正态分布,不服从正态分布,n较大则较大则 服从正服从正态分布;态分布;n较小,较小,为非为非正态分布;正态分布;Oct 20,2009标准误:估计抽样误差大小的指标标准误:估计抽样误差大小的指标标准误标准误(standard error,SE):样本统计量的标准差;样本统计量的标准差;样本均数的标准误样本均数的标准误(standard error of mean,SEM):;样本均数的标准误的估计值:样本均数的标准误的估计值:Oct 20,2009例例 20002000年某研究者随机调查某地健康成年年某研究者随机调查某地健康成年男子男子2727人,得到血红蛋白含量的均数为人,得到血红蛋白含量的均数为125g/L125g/L,标准差为标准差为15g/L15g/L。试估计该样本均试估计该样本均数的抽样误差。数的抽样误差。Oct 20,2009均数标准误的含义均数标准误的含义反映均数抽样误差大小的一个指标;反映均数抽样误差大小的一个指标;均数的标准误均数的标准误 与原分布的标准差成与原分布的标准差成 正比,与抽样样本量正比,与抽样样本量n开根号成反比;开根号成反比;欲减少抽样误差,可增加样本量;欲减少抽样误差,可增加样本量;利用均数标准误可以进行总体均数的可信区间的估利用均数标准误可以进行总体均数的可信区间的估计和假设检验。计和假设检验。Oct 20,2009二、t分布(tdistribution)t t分布分布的由来的由来t t分布分布的图形和特征的图形和特征t t界值表界值表Oct 20,2009 标准正态变换标准正态变换X0,1ut变换变换0t抽抽样样实实验验 t分布的由来XOct 20,2009t t分布分布图形的演变图形的演变Oct 20,2009 t分布图形的演变Oct 20,2009t分布图形的特征n单峰分布,以单峰分布,以0为中心,左右对称为中心,左右对称n只有一个参数只有一个参数 (自由度自由度n-1),n-1),越小,则越小,则t值越分散,峰部越值越分散,峰部越矮而尾部矮而尾部 翘得越高翘得越高n当当逼近逼近时,时,t分布逼分布逼 近近u分布分布Oct 20,2009t t分布分布图形下面积具有规律性图形下面积具有规律性总面积为总面积为1;任意两区间的面积都可以用积分的方法求出;任意两区间的面积都可以用积分的方法求出;当单双侧确定时,自由度当单双侧确定时,自由度确定时,确定时,尾部面积尾部面积()与横与横轴轴t值之间有一一对应的关系;值之间有一一对应的关系;t/2,表示双侧尾部面积为表示双侧尾部面积为,自由度为自由度为时的时的t t界值;界值;t,表示单侧尾部面积为表示单侧尾部面积为,自由度为自由度为时的时的t t界值;界值;Oct 20,2009Oct 20,2009t t界值表的特点界值表的特点表示在单双侧确定时,自由度表示在单双侧确定时,自由度确定时,确定时,t界界值越大,外围面积值越大,外围面积(P)越小;反之亦然;越小;反之亦然;单双侧确定时,外围面积单双侧确定时,外围面积(或或P)确定时,自确定时,自由度由度越大,越大,t界值越小,当界值越小,当 时,时,t=u;t=u;t0.05/2,=1.96=1.96;t0.01/2,=2.58=2.58Oct 20,2009第四节第四节 二项分布二项分布(binomial distributionbinomial distribution)Oct 20,2009BernoulliBernoulli试验试验以A表示所感兴趣的事件,A事件发生称为“成功”,不出现称为“失败”。相应的这类试验称作为“成一败型”试验或Bernoulli试验。Oct 20,2009Bernoulli试验满足条件(1)每次试验结果只能是两个互斥结果之一(A或非A)。(2)每次试验的条件不变,每次试验结果A事件发生的概率为常数。(3)各次试验独立,即每次试验出现事件A的概率与前面各次试验出现的结果无关。Oct 20,2009二项分布的概念二项分布的概念n次重复独立试验(Bernoulli试验),当每次试验的“阳性概率”保持不变时,出现“阳性”的次数k=0,1,2,n的一种概率分布。,k=0,1,2,n n为试验例数,k为阳性次数,为阳性率,Oct 20,2009n当n和不同时,二项分布的概率是不同的,所 以说n和是二项分布的两个重要参数。n如果随机变量x服从以n和为参数的二项分布,则记作xB(n,)。Oct 20,2009二项分布的概率计算二项分布的概率计算 恰好有k例阳性数的概率为最多发生k例,即xk的累计概率 为最少发生k例,即xk的累计概率 二项分布概率的递推公式为Oct 20,2009二项分布的概率计算例题二项分布的概率计算例题例57 据报道,对某药有10%的人有胃肠道反应。为考察某药厂产品质量随机抽取5人服用此药,试求:(1)3人有反应的概率(2)最多2人有反应的概率(3)有人有反应的概率Oct 20,2009二项分布的性质二项分布的性质 Oct 20,20092 2、二项分布的正态近似、二项分布的正态近似 (normal(normal approximation)approximation)Oct 20,2009概率论中的中心极限定理证明:当n足够大时,且不接近于0也不接近于1时,且 n 和n(1)5,二项分布xB(n,)近似于正态分布 N(n,)。Oct 20,2009样本率的分布和正态近似样本率的分布和正态近似 Oct 20,2009样本率的分布和正态近似样本率的分布和正态近似例59 从阳性率样本率=0.6的总体中随机抽取样本量为16的样本,求样本率p的均数和标准差。样本均数的标准差称为均数的标准误。同样样本率的标准差也称为率的标准误,它描述了样本率抽样误差的大小。Oct 20,2009样本率的分布和正态近似样本率的分布和正态近似样本率分布的正态近似 当样本量n较大,总体率不接近于0也不接近1时,且n 和n(1)5,样本阳性率也近似服从正态分布pN(,)。n 事实上,总体率,一般是不知道的,往往用p来估计,用样本率的标准误的估计值 来估计 。Oct 20,2009Oct 20,2009第四节第四节 泊松分布(泊松分布(poisson distribution)是一种典型的离散型随机变量的分布,主要用于描述事件出现概率很小而样本含量或试验次数很大的随机变量的概率分布。当n-,P0.05时,这时二项分布向泊松分布逼近;泊松分布用来分析医学上人群中遗传缺陷、癌症等发病率很低的非传染性疾病的发病或患病人数的分布;也可用于研究单位时间、空间、容积内某罕见时间发生次数的分布;Oct 20,2009Poisson分布是二项分布的特例,由于这时n特别大,p特别小,在数学上用二项分布计算n次重复独立试验(Bernoulli试验),出现“阳性”的次数X=0,1,2,n的概率变得十分困难,所以,可以通过Poisson分布近似计算出现“阳性”次数X概率值如已知年上海市万妇女人群中乳腺癌的发病人数为人(=0.0004),计算某小区万人中刚好出现人的概率?Oct 20,2009二项分布的概率公式可推导出泊松分布的概率计算公式为:为单位时间(空间)稀有事件的发生数(阳性数)的总体均数.二项分布当n很大而很小时即逼近于参数=n的泊松分布,记做xP()Oct 20,2009Oct 20,2009泊松分布的概率计算泊松分布的概率计算 泊松分布概率计算的递推公式:Oct 20,2009Oct 20,2009泊松分布的性质 1、泊松分布均数等于方差:=2=Oct 20,20092.泊松分布的可加性Oct 20,2009 泊松分布的正态近似泊松分布的正态近似Oct 20,2009数理统计证明:当足够大时,泊松分布趋向于正态分布。所以只要相当大(如50)即可认为泊松分布近似于正态分布。Oct 20,2009二项分布的泊松分布近似二项分布的泊松分布近似 例514 根据以往经验新生儿染色体异常为1%,试分别用二项分布和泊松分布原理求100名新生儿中发生x例染色体异常的概率 Oct 20,2009

    注意事项

    本文(基本分布.ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开