概率第七章样本分布优秀PPT.ppt
《概率第七章样本分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《概率第七章样本分布优秀PPT.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率第七章样本分布你现在浏览的是第一页,共51页本章转入课程的第二部分本章转入课程的第二部分数理统计数理统计你现在浏览的是第二页,共51页 从历史的典籍中,人们不难发现许多关从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作明人们很早就开始了统计的工作.但是当时但是当时的统计,只是对有关事实的简单记录和整理,的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些而没有在一定理论的指导下,作出超越这些数据范围之外的推断数据范围之外的推断.你现在浏览的是第三页,共51页 到了十九世纪末二
2、十世纪初,随着到了十九世纪末二十世纪初,随着近代数学近代数学和和概率论概率论的发展,才真正诞生的发展,才真正诞生了数理统计学这门学科了数理统计学这门学科.你现在浏览的是第四页,共51页 学习数理统计无须把过多时间化在学习数理统计无须把过多时间化在计计算算上,可以更有效地把时间用在上,可以更有效地把时间用在基本概基本概念、方法原理念、方法原理的正确理解上的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SAS,SPSS,STAT等,等,都可以让你快速、简便地进行数据处理和分析都可以让你快速、简便地进行数据处理和分析,常用常用的表格处理文件的表格处理文件excel文件也有很多数据处理的
3、功能文件也有很多数据处理的功能.计算机的诞生与发展,为数据处理提供了计算机的诞生与发展,为数据处理提供了强有力的技术支持,强有力的技术支持,数理统计与计算机的结数理统计与计算机的结合合是必然的发展趋势是必然的发展趋势.你现在浏览的是第五页,共51页 第一个问题是怎样进行抽样,使抽得的第一个问题是怎样进行抽样,使抽得的样本更合理样本更合理,并有更好的代表性?这是抽样方并有更好的代表性?这是抽样方法和试验设计问题:最简单易行的是进行随法和试验设计问题:最简单易行的是进行随机抽样机抽样.第二个问题是怎样从取得的样本去推断总第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?体?这种推断
4、具有多大的可靠性?统计推断统计推断(核心核心)问题问题.你现在浏览的是第十一页,共51页统计推断统计推断统计估计统计估计统计检验统计检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数假设检验参数假设检验非参数假设检验非参数假设检验你现在浏览的是第十二页,共51页统计方法具有统计方法具有“部分推断整体部分推断整体”的特征的特征.因为我们是从一小部分样本观察值去推断因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体该全体对象(总体)情况,即由部分推断全体.这里使用的推理方法是这里使用的推理方法是“归纳推理归纳推理”:它在作:它在作出结论时,是根据所观
5、察到的大量个别情况,出结论时,是根据所观察到的大量个别情况,“归纳归纳”起来所得。起来所得。你现在浏览的是第十四页,共51页 组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,X 的分布函数和数字特征称为总体的分布函数和数字特征一一.总体和样本总体和样本总体总体个体个体例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.它是一个随机变量(或多维随机变量)记为X 你现在浏览的是第十六页,共51页样本 从总体中抽取的部分个体称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实
6、现用 表示样本,n 称为样本容量样本空间 样本所有可能取值的集合 你现在浏览的是第十七页,共51页 在进行抽样时,样本的选取是随机的,即总体中每个 实际中,如总体样数很大,而抽取的样本容量相对小,简单随机样本简单随机样本:进行重复抽样所得的随机样本.个体都有同等机会被选入样本。抽样通常有两种方式:一种是不重复抽样,另一种是重复抽样。如果总体单位数是无限的,抽取有限个不影响总体的分布(此时重复抽取与不重复抽取没有多大区别)。即可认为总体为无限的.(现在我们只研究简单随机样本)你现在浏览的是第十八页,共51页 简单随机样本具有以下两个性质:简单随机样本具有以下两个性质:(2)代表性代表性:即:即
7、中的每一个都与中的每一个都与(1)独立性独立性:即:即 中,各个随机变量中,各个随机变量的取值互不影响,这时,我们称的取值互不影响,这时,我们称 是相互是相互独立的随机变量独立的随机变量 总体总体 有相同的概率分布有相同的概率分布 相同分布的随机变量离散型的具有相同的概率分布律相同分布的随机变量离散型的具有相同的概率分布律连续型的具有相同的概率密度,所以期望与方差全相同连续型的具有相同的概率密度,所以期望与方差全相同你现在浏览的是第十九页,共51页样本容量为n的样本是n个相互独立且与总体有相同分布记为 的随机变量(n为样本容量),是n元随机变量 的一个样本观测值,记为 构成的一个构成的一个n元
8、随机元随机变量变量,一个容量为一个容量为n的样本的样本-(1)指一个)指一个n元随机变量。元随机变量。从这个角度来说,从这个角度来说,(2)指某一次抽样的具体数值。)指某一次抽样的具体数值。从这个角度来说,从这个角度来说,你现在浏览的是第二十页,共51页统计量定义统计量定义:为统计量,其中 不含未知参数都是统计量 3统计量统计量的函数 样本 统计统计量量一般是样本 的连续函数,由于样本 是随机变量,因而它的函数也是随机变量随机变量。如:你现在浏览的是第二十一页,共51页二样本分布函数二样本分布函数在实际统计工作中,数据的处理形式为表和图。统计表有简单表和分组表;统计图有频数(率)图,频率直方图
9、和累计频率直方图。1.分组数据的统计表和频数直方图分组数据的统计表和频数直方图简单表就是依出现的先后次序或按其数值大小列成表格,一般用处不大。如果数据较多,可分成若干组,按各组数值大小列成表格或制图例1.观察新生女婴儿的体重 (它是一个连续型随机变量)取取170号按顺序测得体重如表号按顺序测得体重如表7-1.你现在浏览的是第二十二页,共51页此表是体重此表是体重按出生顺序按出生顺序排序排序.单位为克单位为克(g)你现在浏览的是第二十三页,共51页分组数据的频数分布表分组数据的频数分布表分组时一般采取等区间分组分组时一般采取等区间分组,区间长度称为组距区间长度称为组距.制作分组数据表的步骤制作分
10、组数据表的步骤:(1)从数据找出最大值从数据找出最大值M与最小值与最小值L,并求出它们的差并求出它们的差.这里:这里:L=1800,M=4280,M-L=2480(2)决定分组的界限。一般采用包含区域()决定分组的界限。一般采用包含区域(L,M)的稍宽区域的稍宽区域(a,b)为分组的界限。为分组的界限。这里取:这里取:a=1700,b=4300,L,M a,b(3)决定组距决定组距(用用D表示表示)和组数和组数(用用k表示表示),它们之间的关系它们之间的关系为为D=(b-a)/k,取组数时常常按照一定的经验法则,取组数时常常按照一定的经验法则,一般一般来说来说,决定组数应使每组至少有个决定组数
11、应使每组至少有个4、5个数据,当数据很个数据,当数据很多时,只要可以反映分布的趋势,也可以每组很多数据。多时,只要可以反映分布的趋势,也可以每组很多数据。这里:取这里:取k=13,D=(b-a)/k=(4300-1700)/13=200你现在浏览的是第二十四页,共51页其中落到各组的数据个数称为组频数。其中落到各组的数据个数称为组频数。你现在浏览的是第二十五页,共51页例例2 将例将例1中前中前20个新生婴儿体重按大小顺序列成一简单个新生婴儿体重按大小顺序列成一简单统计表,如下表所示。统计表,如下表所示。25832组频数37503450315028502550组中值3600-39003300-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 第七 样本 分布 优秀 PPT
限制150内