[数学]6第六章-统计量及其分布.ppt
《[数学]6第六章-统计量及其分布.ppt》由会员分享,可在线阅读,更多相关《[数学]6第六章-统计量及其分布.ppt(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学数学6第六章第六章-统计量及其分布量及其分布 从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.6.1 数理统计学简介一 什么是数理统计学 研究随机现象规律性的一门学科,以概率论问题作出推断、预测和决策.资料,对数据进行分析(统计分析)从而对所研究的为基础,研究如何用有效的方法收集和利用数据 具体地说,就是研究从一定总体中随机抽出一部分(样本),对样
2、本的性质进行研究,以对总体的性质作出推测性判断的科学(例如,产品质量,人均收入).为什么要用样本去推测和判断总体的性质,主要有以下几个原因:破坏性 数量巨大因为是用部分去推断总体的性质,所以得出的结论就不一定完全正确,分析方法的关键是使可能产生的错误越小越好,以对所提问题作出尽可能正确的结论.数理统计和概率论有着密切的联系,概率论是数理统计的基础,数理统计是概率论的应用.概率论是将事件出现的频率抽象为概率的概念进行研究,并由此建立了随机变量的概率分布的基本理论.数理统计则是直接从随机现象的观测值去研究其客观规律性.二 数理统计学的基本内容 统计推断根据实际问题的不同要求,产生了数理统计学的众多
3、研究分支.本课程侧重于概括起来分为两大类:试验的设计和研究例1 某钢筋厂日产钢筋10000根,质量检查员每天抽查其中50根的强度.(1)如何从这50根钢筋的强度数据去估计整批10000根的强度平均值,如何估计整批钢筋强度偏离平均值的离散程度?(2)如果规定了这种钢筋的标准强度,如何由抽查的50个强度数据判断整批钢筋的平均强度与标准强度有无差异?(于是可提出很多问题)此问题为参数估计.此问题为假设检验.(3)抽查的50个强度数据有大有小,如果当天生产的钢筋是采取不同工艺生产的,那么强度呈现的差异是由于工艺不同造成的,还是仅仅由随机因素造成的?(4)如果钢筋强度与某种原料的成分含量有关,那么从抽查
4、的50个强度与该原料含量的50组对应数据,如何去表达整批钢筋强度与该原料含量的关系?此问题为方差分析,即分析造成强度差异的原因.此问题为回归分析.以上四个问题都是数理统计学研究的基本内容,此外还有正交试验设计,多元统计分析,时间序列分析,抽样理论,质量控制,可靠性理论和统计决策理论等.总体中所含个体的数目可以是有限的,也可以是6.2 总体和样本一 总体 个体 样本总体总体:就是研究对象的全体.个体个体:是组成总体的每个元素.无限的,分别称为有限总体有限总体和无限总体无限总体.从总体中随机抽取n 个个体,称为容量为n的样本(子样).任何一个总体,都可以用一个随机变量X 来表示.例如,从一批日光灯
5、中随机抽取一个,其寿命X 显然是为相同值的日光灯在这批日光灯中所占的比例.因此,一个随机变量,它取各种可能值的概率恰好就是寿命如果知道X的分布,则这批日光灯的寿命情况就完全清楚了.即可以用X 及其分布来描述这批日光灯这一总体.再例如,从某大学全体学生中随机抽取一个,其学习成绩X 显然是一个随机变量,它取各种可能值的概率恰好就是成绩为相同值的学生在全校所占的比例.因此,可以用X 及其分布来描述该校全体学生这一总体.在统计研究中,人们关心的仅仅是代表总体的一项(或几项)数量指标以及数量指标的分布情况.总体就是指某个随机变量X可能取值的全体。X的分布称为总体的分布.常用“总体 X 服从.分布”这一说
6、法.从总体X中随机抽取容量为n的样本,用表示.不难理解,X 及都是随机变量.是n维随机变量.简单随机样本简单随机样本 简单随机样本是应用中最常见的情形,今后若取自总体X的样本X1,X2,Xn 相互独立且与X 有相同的分布,则称X1,X2,Xn为取自总体X 的简单随机样本简单随机样本.简称为样本样本.当说到“X1,X2,Xn 是取自某总体的样本”时,若不特别说明,均指简单随机样本.(x1,x2,xn),称为样本的一组观测值,简称样本值样本值.一旦取定一组样本,得到的是n个具体的数一般来说,不同次的抽取(每次取n个),将得到不同的样本观测值.样本所有可能取值的全体称为样本空间,它是n维空间或其中的
7、一个子集.一组样本观测值(x1,x2,xn)就是样本空间中的一个点.定理1 若(X1,X2,Xn)是取自总体X的样本,而X的概率密度为f(x)(或分布函数为F(x),则(X1,X2,Xn)的联合密度函数为(或联合分布函数为)总体X的一个样本,求样本的联合密度.例1设总体解:因为XU1,2,其密度为Xi的密度样本的联合密度为二 理论分布和经验分布 作出经验分布用以观察理论分布的概况.若总体是随机变量X,则X 的分布就是总体的分布(称为理论分布).样本是总体的代表和反映,简单随机样本能很好地反映总体的情况.通常的方法是若x1,x2,xn 为总体X 的n个独立观测值,称Fn*(x)为总体X作n次独立
8、观察的经验分布函数.并作函数定义将这些值按从小到大的顺序排列为x1*x2*.xn*从图中可以看到,Fn*(x)是F(x)的一个近似.关于Fn*(x)与理论分布F(x)的关系,有如下定理:对于样本的不同取值,将得到不同的经验分布函数Fn*(x),所以对于x的每一个数值,Fn*(x)是一个随机变量.当n时,Fn*(x)以概率1关于x一致收敛于F(x),这个定理是用样本推断总体的基本理论依据.定理2(格列汶科)即Fn*(x)的图形是一条阶梯形曲线,若样本观测值不重复,则每一跃度为;若有重复,则按的倍数为跃度.显然经验分布函数Fn*(x)具有以下性质:0Fn*(x)1Fn*(x)单调上升Fn*(x)右
9、连续三 分布密度的近似求法(略)如果X是一个连续型随机变量,可以用样本观测值作出的频率直方图来近似代替分布密度曲线.由样本去推断总体情况,需要对样本进行“加工”和“提炼”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.一 统计量6.3 统计量和抽样分布定义设(X1,X2,.,Xn)为取自总体X的一个样本,T=T(X1,X2,.,Xn)为样本(X1,X2,.,Xn)一个实值连续函数,且T中不含任何未知参数,则称T(X1,X2,.,Xn)为一个统计量统计量.注:1.统计量是不含任何未知参数的样本的函数,2.统计量T=T(X1,X2,.,Xn)是随机变量,它应该有确定它是完全
10、由样本决定的量.的概率分布.统计量的分布称为抽样分布抽样分布.例1而都不是统计量.都是统计量,是取自总体X 的一个样本,则设总体XN(,2),其中,2未知 几个常见的统计量:样本均值样本均值:样本方差样本方差:设X1,X2,.,Xn 是取自总体X的一个样本,因为样本k 阶原点矩:样本k阶中心矩:k=1,2,样本标准差:k=1,2,显然 样本(X1,X2,.,Xn)的观察值为(x1,x2,xn)的观察值分别记为 通常,大写字母表示统计量,如 小写字母表示观察值,如顺序统计量定义设(X1,X2,.,Xn)为取自总体X的一个样本,现由样本建立n个函数:(X1,X2,.,Xn)k=1,2,.,nx1*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 第六 统计 及其 分布
限制150内