欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    概率与统计随机抽样用样本估计总体变量间的相互.pptx

    • 资源ID:5637600       资源大小:267.79KB        全文页数:80页
    • 资源格式: PPTX        下载积分:50金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要50金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    概率与统计随机抽样用样本估计总体变量间的相互.pptx

    第十模块第十模块 概率与统计概率与统计第四十八讲第四十八讲 随机抽样随机抽样 用样本估计用样本估计总体总体 变量间的相互关系变量间的相互关系 统计案例统计案例回归课本1.样本及抽样的定义(1)在数理统计中称研究对象的全体为总体,组成总体的每一个基本单元为个体,从总体中抽取若干个个体x1,x2,xn,这样的n个个体x1,x2,xn称为大小为n(容量为n)的一个样本.(2)抽样:抽样是为了获取总体的信息,特别在客观实际中对总体的全部个体逐一进行研究,有的是不适宜不可能或不必要的.因此,抽样调查是获取总体信息的重要方法.2.随机抽样(1)简单随机抽样:从一个总体中通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,这样的抽样称为简单随机抽样.这样抽出的样本称为简单随机样本.简单随机抽样的基本方法有抽签法和随机数表法. (2)系统抽样:系统抽样被称为等距抽样或机械抽样.它按照时间或空间的等距间隔抽取样本,即将总体分成几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样称为系统抽样.系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样. (3)分层抽样:当总体中一部分个体与另一部分个体有明显的差异且易于区别时,常将相近的个体归成一组,然后按照各部分所占的比例进行抽样,这种抽样称为分层抽样.其中所分成的各部分称为层.分层抽样时,每一个个体被抽到的概率都是相等的.3.频率分布表频率分布直方图与茎叶图(1)频率分布样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表频率分布直方图频率分布折线图茎叶图等来表示.(2)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (3)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体在各小组内所取值的个数与总数比值的大小,它可以用一光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.(4)茎叶图表示数据有两个突出的优点,其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.4.用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数在一组数据中,出现次数最多的数据叫做这组数据的众数.将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.如果n个数,x1,x2,xn,那么 (x1+x2+xn)叫做这n个数的平均数.总体中所有个体的平均数叫做总体平均数.样本中所有个体的平均数叫做样本平均数,如果在n个数据中,x1出现了f1次,x2出现f2次,xk出现fk次(这里f1+f2+fk=n),那么 (x1f1+x2f2+xkfk),叫做这n个数的加权平均数.1xn1xn12n2222122221221,()()() ,1()()() , 2,x , x , x,ss, s.nnxxxxxxxnsxxxxxxn样 本 方 差 标 准 差 设 样 本 的 元 素 为样 本 的平 均 数 为定 义其 中表 示 样 本方 差表 示 样 本 标 准 差5.两个变量的相关关系(1)当自变量的取值一定时,因变量的取值带有随机性,这两个变量之间的关系叫做相关关系.如果一个变量的值由小变大时,另一个变量的值也在由小到大,这种相关称为正相关;反之,如果一个变量的值由小变大时,另一个变量的值在由大到小,这种关系称为负相关.变量间的这种关系与函数关系不同,它是一种非确定关系. (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.回归直线方程(1)一般地,设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程为 ,yabx则我们将这个方程叫做回归直线方程,a,b叫做回归系数,相应的直线叫做回归直线. (2)最小二乘法使离差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2为最小的方法,叫做最小二乘法.7.回归分析(1)回归直线方程 =bx+a中, 上述方程对应的直线叫做回归直线,而对两个变量所进行的上述统计分析叫做线性回归分析.相关系数y1221,niiiniix yn xybayb xxn x1222211niiiiiinix yn xyrxn xyn y 用相关系数来描述线性相关关系的强弱.当r0时,两个变量正相关;当r0时,两个变量负相关,r的绝对值越接近1,表明两个变量的线性相关性越强,r的绝对值接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于r0.05时,认为两个变量有很强的线性相关关系,因而求回归直线方程才有意义.数据点和它在回归直线上相应位置的差异(y1- i)是随机误差效应,称 i=yi- i为残差,将所得值平方后加起来,用数学符号表示为 (yi- i)2称为残差平方和,它代表了随机误差的效应.yey1niy8.独立性检验(1)分类变量的定义如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)22列联表一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为K2= 用它的大小可以决定是否拒绝原来的统计假设H0,如果K2值较大,就拒绝H0,即拒绝事件A与B无关.2()()()()()n adbcabcdacbd考点陪练1.(2010重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为( )A.7 B.15C.25 D.35解析:设样本容量为n,则依题意有 n=7,n=15,选B.答案:B3507502.(2010湖北)将参加夏令营的600名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300的第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为( )A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9解析:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是3+12(k-1).令3+12(k-1)300,得k ,因此第营区被抽中的人数是25;令3003+12(k-1)495得 10.828,所以我们有99.9%的把握说,A,B两药对该病的治愈率之间有显著差别.方法与技巧 上述结论是对所有服用A药或B药的病人而言的,绝不要误以为只对100个病人成立.这就体现了统计的意义,即由样本推断出全体.技法二数形结合思想【典例2】 为了了解中学生的身高情况,对某中学同龄的若干女生的身高进行测量,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右15组的频率分别为0.05,0.10,0.15,0.15,0.30,68组的频数分别为7,5,3,第二小组的频数为6. (1)画出频率分布表;(2)试问这组数据中的中位数在哪个身高的范围内?(3)如果本次测试身高在157 cm以上(包括157 cm)的为良好,试估计该校女生身高良好率是多少? 解题切入点 通过第二组的频数和频率先求出学生总数,其他问题就十分容易解决了,主要考查同学们对频率分布表和频率分布直方图的掌握情况,考查识图读图的能力,以及灵活运用图表解决实际问题的能力. 解 (1)因为第二组的频数是6,频率是0.1,所以学生总数为60.1=60,所以15组的频数分别为3,6,9,9,18;68组的频率分别为71, 0.05,6012频率分布表如下表所示:(2)中位数在157 cm160 cm之间.(3)因为1-0.05-0.1-0.15-0.15=0.55,所以良好率是0.55.方法与技巧 数形结合的思想是重要的思想方法之一,具有直观性灵活性,有较强的综合性.数形结合的思想的实质就是把抽象的数学语言与直观的图形结合起来,使抽象思维与形象思维结合起来.

    注意事项

    本文(概率与统计随机抽样用样本估计总体变量间的相互.pptx)为本站会员(修****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开