统计基本概念.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计基本概念.pptx》由会员分享,可在线阅读,更多相关《统计基本概念.pptx(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、作出精确而可靠的结论作出精确而可靠的结论.数理统计可以分为数理统计可以分为两大类两大类:一类是如何合理地安排试验,一类是如何合理地安排试验,-描述统计学描述统计学如:试验设计、抽样方法。如:试验设计、抽样方法。另一类是研究如何分析所获得的随机数据,另一类是研究如何分析所获得的随机数据,对所研究对所研究的问题进行科学的、合理的估计和推断,的问题进行科学的、合理的估计和推断,尽可能地尽可能地为为采取一定的决策提供依据,采取一定的决策提供依据,-推断统计学推断统计学,如:参数估计、假设如:参数估计、假设 检验等。检验等。以获取有效的随机数据。以获取有效的随机数据。数理统计数理统计第1页/共115页1
2、00100个样品进行强度测试,于是面临下列几个问题:个样品进行强度测试,于是面临下列几个问题:例如例如某厂生产一型号的合金材料,某厂生产一型号的合金材料,用随机的方法选取用随机的方法选取1、估计这批合金材料的强度均值是多少、估计这批合金材料的强度均值是多少?(参数的点估计问题)参数的点估计问题)2、强度均值在什么范围内?、强度均值在什么范围内?(参数的区间估计问题)参数的区间估计问题)3、若规定强度均值不小于某个定值为合格,那么这、若规定强度均值不小于某个定值为合格,那么这批材料是否合格?批材料是否合格?(参数的假设检验问题)参数的假设检验问题)4、这批合金的强度是否服从正态分布?、这批合金的
3、强度是否服从正态分布?5、若这批材料是由两种不同工艺生产的,那么不同、若这批材料是由两种不同工艺生产的,那么不同的工艺对合金强度有否影响?的工艺对合金强度有否影响?若有影响,那一种工艺若有影响,那一种工艺生产的强度较好?生产的强度较好?(分布检验问题)分布检验问题)(方差分析问题)方差分析问题)第2页/共115页6、若这批合、若这批合金金由几种原料用不同的比例合成,那么由几种原料用不同的比例合成,那么如何表达这批合金的强度与原料比例之间的关系?如何表达这批合金的强度与原料比例之间的关系?(回归分析问题)回归分析问题)我们依次讨论参数的点估计、区间估计、假设检验、我们依次讨论参数的点估计、区间估
4、计、假设检验、方差分析、回归分析方差分析、回归分析下面引入一些数理统计中的术语。下面引入一些数理统计中的术语。第3页/共115页二、统计量二、统计量一、总体与样本一、总体与样本 抽样和抽样分布抽样和抽样分布三、几个常用的分布三、几个常用的分布四、正态总体统计量的分布四、正态总体统计量的分布第4页/共115页1.1.总体总体研究对象的某项数量指标值全体称为总体总体(母体母体)个体个体总体中每个成员(元素)研究某批灯泡的质量研究某批灯泡的质量总体总体考察国产考察国产 轿车的质量轿车的质量总体总体一一 总体和样本总体和样本第5页/共115页破坏性的试验更是不允许对整个总体进行考察破坏性的试验更是不允
5、许对整个总体进行考察.考察某工厂生产的灯泡寿命考察某工厂生产的灯泡寿命考察某型号手机的质量考察某型号手机的质量考察吸烟和患肺癌的关系考察吸烟和患肺癌的关系在实际问题中,在实际问题中,要考察整个总体往往是不可能的,要考察整个总体往往是不可能的,因为它需要耗费太多的资源和太多的时间因为它需要耗费太多的资源和太多的时间.有些有些2.2.样本样本第6页/共115页样本中所包含的个体数目称为样本容量样本中所包含的个体数目称为样本容量.从国产轿车中从国产轿车中抽抽5 5辆进行辆进行耗油量试验。耗油量试验。样本容量为样本容量为5 5。为了推断总体分布及各种特征,为了推断总体分布及各种特征,一个可行的办法一个
6、可行的办法是从该总体中按一定的规则抽取若干个个体进行观察是从该总体中按一定的规则抽取若干个个体进行观察和试验,和试验,以获得有关总体的信息以获得有关总体的信息.这一抽取过程称为这一抽取过程称为“抽样抽样”,所抽取的部分个体称为样本所抽取的部分个体称为样本.第7页/共115页方法方法.由于抽样的目的是为了对总体进行统计推断,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体,为了使抽取的样本能很好地反映总体,必须考虑抽样必须考虑抽样 统计中,采用的抽样方法是随机抽样法,统计中,采用的抽样方法是随机抽样法,即子样中每个个体是从母体中随意地取出来的。即子样中每个个体是从母体中随
7、意地取出来的。第8页/共115页(1 1)重复(返回)抽样重复(返回)抽样分量分量X Xk k与所考察的总体有相同的分布与所考察的总体有相同的分布.从总体中抽取个体检查后放回,从总体中抽取个体检查后放回,母体成分不变(分布不变)母体成分不变(分布不变)相互独立的随机变量相互独立的随机变量.第9页/共115页对无限母体而言做无返回抽取,并不改变母体的成分对无限母体而言做无返回抽取,并不改变母体的成分独立且同分布于母体独立且同分布于母体(2 2)非重复(无返回)抽样非重复(无返回)抽样取出样本后改变了母体的成分,所以取出样本后改变了母体的成分,所以 对有限母体,对有限母体,不相互独立,不相互独立,
8、第10页/共115页(2)(2)独立同分布性独立同分布性它要求抽取的样本满足下面两点它要求抽取的样本满足下面两点:(1)(1)代表性代表性(随机性):(随机性):最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随机抽样简单随机抽样”。其中每一个分量其中每一个分量Xk k与所考察的总体有相同的分布与所考察的总体有相同的分布.每一个个体被抽到的可能性相同。每一个个体被抽到的可能性相同。从总体中抽取样本的每一个从总体中抽取样本的每一个分量分量Xk是随机的是随机的,是相互独立的随机变量是相互独立的随机变量.若不特别说明,就指简单随机样本若不特别说明,就指简单随机样本.简单随机样本是应用中最常见的
9、情形,简单随机样本是应用中最常见的情形,今后当说到今后当说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,时,第11页/共115页简单随机样本可以用与总体独立同分布的简单随机样本可以用与总体独立同分布的n个相互个相互独立的随机独立的随机变量变量若总体若总体X的分布函数为的分布函数为联合分布函数为联合分布函数为若总体若总体X X的分布密度函数为的分布密度函数为表示表示.则其简单随机样本的则其简单随机样本的则其简单随机样本的则其简单随机样本的联合密度函数为联合密度函数为离散总体离散总体则样本的分布列则样本的分布列第12页/共115页样本的联合概率密度为(2)总体X的概率密度为例1对下
10、列总体分别求出样本的联合分布第13页/共115页我们只能观察到随机变量取的值我们只能观察到随机变量取的值,而见不到随机变量而见不到随机变量.3.3.总体、样本、样本值的关总体、样本、样本值的关系系事实上我们抽样后得到的资料都是具体的、确定的值事实上我们抽样后得到的资料都是具体的、确定的值.它们是样本取到的值而不是样本它们是样本取到的值而不是样本.因而可以由样本值去推断总体因而可以由样本值去推断总体.总体分布决定了样本取值的概率规律,总体分布决定了样本取值的概率规律,也就是样本也就是样本取到样本值的规律,取到样本值的规律,去推断总体的情况去推断总体的情况-总体分布总体分布F(x)的性质的性质.样
11、本是联系二者的桥梁样本是联系二者的桥梁统计是从手中已有的资料统计是从手中已有的资料-样本值,样本值,第14页/共115页4.4.样本的分布样本的分布1 1)样本的频数分布)样本的频数分布将将n个样本值个样本值按从小到大排列,把相同按从小到大排列,把相同的数合并,并指出其频数(样本中各数出现的次数)的数合并,并指出其频数(样本中各数出现的次数)x频数频数频率频率第15页/共115页1 1)样本的经验分布函数)样本的经验分布函数样本值样本值 样本值小于或等于样本值小于或等于x x的个数,作的个数,作 样本的经验分布函数样本的经验分布函数给出了在给出了在n n次独立重复试验中,事件次独立重复试验中,
12、事件出现的频率,具有分布函数的一切性质。如:出现的频率,具有分布函数的一切性质。如:非降,右连续;非降,右连续;第16页/共115页由频数分布知由频数分布知第17页/共115页若样本为若样本为n维维r.vr.v,那么对于每一样本值,那么对于每一样本值就可作一个经验分布函数,故就可作一个经验分布函数,故是随机变量是随机变量-n次独立重复试验中,事件次独立重复试验中,事件发生的频率。发生的频率。由伯努利大数定律,由伯努利大数定律,第18页/共115页格列汶科进一步证明了:当格列汶科进一步证明了:当n时,时,Fn(x)以以概率概率1 1关于关于x一致收敛于一致收敛于F(x),即,即这就是著名的格列汶
13、科定理这就是著名的格列汶科定理.格列汶科定理的优缺点格列汶科定理的优缺点1 1、当样本容量、当样本容量n足够大时,对所有的足够大时,对所有的x,Fn(x)与与F(x)之差的绝对值都很小,且这件事发生的概之差的绝对值都很小,且这件事发生的概率为率为1.1.第19页/共115页2、Fn(x)是一统计量,则 也是一统计量,用来表示Fn(x)与F(x)的最大差异,且概率为1的收敛于零。3、定理没有给出 的分布或极限分布 这就是我们可以由样本推断总体的基本理论依据第20页/共115页定理:样本均值以概率收敛于EX,样本方差以概率收敛于总体方差DX,样本矩以概率收敛于总体矩第21页/共115页五、直方图五
14、、直方图(1)(1)离散情况离散情况(2)(2)连续情况连续情况其中其中 为未知。如何估计为未知。如何估计?ip 设设总总体体X为为连连续续型型随随机机变变量量,如如何何估估计计未未知的密度函数知的密度函数f(x)?第22页/共115页定义定义1 设设 是来自总体是来自总体X的一个样本,的一个样本,为一实值连续函数,为一实值连续函数,其不包含任何其不包含任何未知参数,则称未知参数,则称为一个为一个统计量统计量。为为的观测值。的观测值。注:注:是随机变量的函数仍为随机变量。是随机变量的函数仍为随机变量。便是一个数。便是一个数。注:统计量是随机变量。注:统计量是随机变量。二 统计量1.1.统计量统
15、计量第23页/共115页例1为来自总体的样本 未知,已知,判断下列函数哪些是统计量。第24页/共115页2.几个常见的统计量几个常见的统计量样本均值样本方差它反映了总体它反映了总体 均值的信息均值的信息是来自总体X的一个样本,它反映了总体它反映了总体 方差的信息方差的信息样本标准差第25页/共115页证证左边重要公式重要公式第26页/共115页样本k 阶原点矩样本k 阶中心矩它反映了总体它反映了总体k阶矩阶矩的信息的信息它反映了总体k 阶中心矩的信息第27页/共115页常见统计量的性质常见统计量的性质第28页/共115页第29页/共115页是来自总体例2设的一样本,总体的阶矩存在,证明(1)(
16、2)证证独立且与同分布独立且与同分布由辛钦大数定律,知第30页/共115页充分统计量与完备统计量充分统计量定义:设 是来自总体X具有分布函数 当给定 时,若样本 的条件分布与参数 无关,则称 是 的 充分统计量 第31页/共115页充分统计量含义 样本中包含关于总体分布中未知参 数的信息,是因为样本的联合分布与参 数有关。对统计量T,如果已经知道它的 值以后,样本的条件分布就与参数无关。即在统计量T中包含了参数的全部信息。第32页/共115页用定义证明T是充分统计量例1 设 总体 服从两点分布 ,即 是来自总体 的一个样本,证明样本均值 是参数 的充分统计量证明:由于第33页/共115页当已知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 基本概念
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内