数理统计基础pp.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数理统计基础pp.pptx》由会员分享,可在线阅读,更多相关《数理统计基础pp.pptx(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 数理统计是以概率论为基础,从实际观测的资料出发,研究如何搜集数据来对随机变量的分布函数、数字特征等进行估计、分析和推断。通过研究从一定总体中随机抽出一部分的某些性质,而对总体的性质作出推测性的判断。数理统计其应用领域涉及到工农业生产、科学技术、经济、社会等各个方面,对于产品质量的产量的提高,管理的科学化以及某些事物发展规律的认识都起到了积极的作用。2.1 抽样与抽样分布2.1.1 数理统计的一些基本概念1 总体、个体 总体是指所研究对象的全体。组成总体的元素称为个体。我们关心的是总体的某项数量指标。这些数值在总体中按一定规律分布,可以用随机变量来描述,记为X、Y等。而从总体中任取一个个体,其
2、可能的数值具有一定概率。个体是与总体分布相同的随机变量,记为X1,X2,等。第1页/共43页 1样本 从总体中抽取的一部分个体称为样本(或子样)。样本中个体的个数称样本容量。一个样本由n个个体组成,是一个n维随机变量,记为(X1,X2,Xn)。而某一次抽取的n个具体数据(X1,X2,Xn)称为样本观测值。第2页/共43页3简单随机抽样 为了使抽取的样本能很好地反映总体特性,抽样应满足以下原则:“简单随机抽样”(1)独立性:每次抽取的结果不受其它抽取结果的影响。(2)代表性:每次抽取后不影响总体成分。保证样本每个分量Xi都与总体X具有相同分布 这样的抽样方法称为简单随机抽样。所得到的样本称为简单
3、随机样本。在实际当中,总体容量通常有限,当采用无返回抽样时,每抽取一个个体会改变总体成分。但当总体容量很大时,可近似看作总体成分没有变化。若总体容量不大时,可采用返回抽样。4.统计量 设X1,X2,是一个样本,f(X1,X2,Xn)是样本的一个实值函数,且其中不含未知参数,称f(X1,X2,Xn)为一个统计量。统计量的分布称为抽样分布。例如:若总体XN(,2),其中,2是未知参数,X1,X2是一个样本,则都不是统计量,而都是统计是量。注意到统计量是随机变量,是可以计算得到的。第3页/共43页常用的统计量有 (1)样本均值:(2)样本方差:(3)样本标准差:(4)样本K阶矩:(5)样本K阶中心矩
4、:第4页/共43页212常用的抽样分布 1正态总体中的分布 设X1,X2,Xn是独立分布随机变量,且服从正态分布N(,2)则服从正态分布 设X1,X2,Xn是独立分布的随机变量,且都服从标准正态分布N(0,1),则的分布称为自由度为n的 分布,记为(n)。其概率密度为 分布 第5页/共43页 概率密度函数的图形见图2.1。对给定的,(0 1),称满足称为置信水平,1 称为置信度。一般取0.05或0.01第6页/共43页t分布设 XN(0,1),Y (n),且 X与 Y相互独立,则称的分布为目由度为 n的 t分布。记为Tt(n)。其概率密度为第7页/共43页 概率密度函数h(t)的图形见图2.2
5、。可证明当 n时,t分布的极限是标准正态分布。故当n足够大(一般n45时,t分布的数值可查标准正态分布表。对给定的,(0 1),称满足 的点t(n)为t分布上的分位点(图23)。由t分布的对称性有 t1-a(n)=ta(n)第8页/共43页F分布 设,且 U、V相互独立,则称分子的分布为第一自由度为n1,第二自由度为n2的F分布,记为FF(nl,n2)。其概率密度为 F分布的概率密度函数图形见图2.4。由定义可知,如 FF(nl,n2),则 对给定的,(01),称满足 的点F (nl,n2)为F(nl,n2)分布的分位点。第9页/共43页 F分布的分位点具有性质。此性质可用于求F分布表上未列出
6、的一些分位点。如 第10页/共43页22 参 数 估 计 22l点估计 利用样本X1,X2,,Xn构造一个函数 作为总体分布中未知参数的估计量,称为参数的点估计。2估计量的好坏标准无偏性:参数 的估计量若满足E=,则称为无偏估计量 都是的无偏估计量。因它们的数学期望都为。不是2的无偏估计量 才是2的无偏估计量第11页/共43页(2)有效性:总体方差小有效。因此 有效 第12页/共43页222区间估计 点估计是用一个估计值去估计参数。这个估计值是随机变量,不同的样本会得出不同的估计值,不知道它与的真值相差多少。我们希望估计有一个精度概念,保证的真值不超过某个范围。即希望给出两个端点值,使的真值以
7、比较大的概率被包含在这两个端点构成的区间之内。这就是区间估计。区间估计的定义:设为待估参数。给定数值(0 1),由样本X1,X2,Xn确定出两个统计量1与2,使 P(12)=l 则称随机区间(1,2)为置信区间。1与2分别称为的置信下限和置信上限。称为置信水平。第13页/共43页 置信度1-反映了区间(1,2)包含的概率,即估计的可靠性,而区间(1,2)的长度则反映了估计的精度。“可靠性”与“精度”两者是一对矛盾。1-越大,区间(1,2)包含的概率越大,其长度必定越大。若太大,则失去了估计意义。如果要求精度很高,即(1,2)的长度很短,1-必须减小,估计的可靠性即降低。正确的方法:在给定较大置
8、信度1-下(通常取l-=0.95或0.99),使(1,2)长度最小。第14页/共43页对正态总体的参数给出区间估计的方法。1已知总体方差2,对期望的区间估计总体X服从N(,2),则服从标准正态分布N(0,1)。对给定的,存在分位数,使 如取=0.05时,查正态分布表有u0.025=1.96,代人上式得即随机区间 包含的概率为0.95,不包含的概率为0.05。第15页/共43页例22分析胰腺组成中某种指定物质的含量,从6个分析数据中得到该物质的平均含量为32.56。长期分析中得到其均方差=0.12,试对此次分析中该物质含量在置信度0.95下给出区间估计。解:=0.05,查正态分布表,的置信度为0
9、.95的置信区间为即(32.46,32.66),即该物质含量在32.46到32.66之间的可能性为0.95。第16页/共43页未知总体方差,对期望的区间估计。总体 XN(,2),由于2未知,用样本方差 S2代替,可证明 服从自由度为n1的t分布t(nl)。对给定的置信度 l,由t分布表可查得分位数,使第17页/共43页随机区间即为总体期望的置信度为 l的置信区间。第18页/共43页 例23用某仪器间接测量温度,重复测量10次,结果为1260,1250,1265,1245,1260,1275,1255,1250,1255,1270,问温度的真值在什么范围内?(置信度取0.95)解:=0.05,n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 基础 pp
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内