概率与统计随机抽样用样本估计总体变量间的相互.pptx
《概率与统计随机抽样用样本估计总体变量间的相互.pptx》由会员分享,可在线阅读,更多相关《概率与统计随机抽样用样本估计总体变量间的相互.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十模块第十模块 概率与统计概率与统计第四十八讲第四十八讲 随机抽样随机抽样 用样本估计用样本估计总体总体 变量间的相互关系变量间的相互关系 统计案例统计案例回归课本1.样本及抽样的定义(1)在数理统计中称研究对象的全体为总体,组成总体的每一个基本单元为个体,从总体中抽取若干个个体x1,x2,xn,这样的n个个体x1,x2,xn称为大小为n(容量为n)的一个样本.(2)抽样:抽样是为了获取总体的信息,特别在客观实际中对总体的全部个体逐一进行研究,有的是不适宜不可能或不必要的.因此,抽样调查是获取总体信息的重要方法.2.随机抽样(1)简单随机抽样:从一个总体中通过逐个抽取的方法从中抽取一个样本,
2、且每次抽取时各个个体被抽到的概率相等,这样的抽样称为简单随机抽样.这样抽出的样本称为简单随机样本.简单随机抽样的基本方法有抽签法和随机数表法. (2)系统抽样:系统抽样被称为等距抽样或机械抽样.它按照时间或空间的等距间隔抽取样本,即将总体分成几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样称为系统抽样.系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样. (3)分层抽样:当总体中一部分个体与另一部分个体有明显的差异且易于区别时,常将相近的个体归成一组,然后按照各部分所占的比例进行抽样,这种抽样称为分层抽样.其中所分成的各
3、部分称为层.分层抽样时,每一个个体被抽到的概率都是相等的.3.频率分布表频率分布直方图与茎叶图(1)频率分布样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表频率分布直方图频率分布折线图茎叶图等来表示.(2)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (3)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体在各小组内所取值的个数与总数比值的大小,它可以用一光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.(4)茎叶图表示数据有两
4、个突出的优点,其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.4.用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数在一组数据中,出现次数最多的数据叫做这组数据的众数.将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.如果n个数,x1,x2,xn,那么 (x1+x2+xn)叫做这n个数的平均数.总体中所有个体的平均数叫做总体平均数.样本中所有个体的平均数叫做样本平均数,如果在n个数据中,x1出现了f1次,x2出现f2次,xk出现fk次(这里f1+f2+fk=n),那么 (x1f
5、1+x2f2+xkfk),叫做这n个数的加权平均数.1xn1xn12n2222122221221,()()() ,1()()() , 2,x , x , x,ss, s.nnxxxxxxxnsxxxxxxn样 本 方 差 标 准 差 设 样 本 的 元 素 为样 本 的平 均 数 为定 义其 中表 示 样 本方 差表 示 样 本 标 准 差5.两个变量的相关关系(1)当自变量的取值一定时,因变量的取值带有随机性,这两个变量之间的关系叫做相关关系.如果一个变量的值由小变大时,另一个变量的值也在由小到大,这种相关称为正相关;反之,如果一个变量的值由小变大时,另一个变量的值在由大到小,这种关系称为负
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 随机 抽样 样本 估计 总体 变量 相互
限制150内