统计学第3章概率分布与抽样分布.pptx
《统计学第3章概率分布与抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计学第3章概率分布与抽样分布.pptx(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学统计学STATISTICS1统计学统计学STATISTICS2统计学统计学STATISTICS3.1 随机变量随机变量(random variables)1.对对随机事件随机事件的的数值性描述数值性描述-例如:抛硬币的结果,正面定义为例如:抛硬币的结果,正面定义为1,反,反面定义为面定义为02.一般一般用用 X,Y,Z 来表示来表示3.根据取值情况的不同分为根据取值情况的不同分为离散型随机变量:离散型随机变量:数轴上可列个孤立的数轴上可列个孤立的点点连续型随机变量:连续型随机变量:数轴上一个或多个区数轴上一个或多个区间间3统计学统计学STATISTICS离散型随机变量离散型随机变量1.
2、随机变量随机变量 X 取有限个值或所有取值都可以取有限个值或所有取值都可以逐个列举逐个列举出来出来 x1 , x2,2. 以以确定的概率确定的概率取这些不同的值取这些不同的值3. 离散离散型随机变量的一些例子型随机变量的一些例子4统计学统计学STATISTICS连续型随机变量连续型随机变量1.连续型随机变量可以取某一区间或整个实数轴连续型随机变量可以取某一区间或整个实数轴上的任意一个值上的任意一个值2.它取任何一个特定的值的概率都等于它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率不能列出每一个值及其相应的概率4.通常研究它通常研究它取某一区间值的概率取某一区间值的概率5.
3、用用概率密度函数概率密度函数和和分布函数分布函数的形式来描述的形式来描述5统计学统计学STATISTICS 定义定义 设设X是一随机变量,是一随机变量,X是任意实数是任意实数,则实值函数,则实值函数F(x)P X x, x(-(-,+)+)称为随机变量称为随机变量X的的分布函数分布函数。 有了分布函数定义,任意有了分布函数定义,任意x1,x2R, x1x2,随,随机变量机变量X落在落在( (x1, ,x2 里的概率可用分布函数来计算:里的概率可用分布函数来计算:P x1X x2PX x2PX x1 F(x2)F(x1). 在这个意义上可以说,在这个意义上可以说,分布函数完整地描述了随分布函数完
4、整地描述了随机变量的统计规律性机变量的统计规律性,或者说,或者说,分布函数完整地表示分布函数完整地表示了随机变量的概率分布情况了随机变量的概率分布情况。 分布函数的定义6统计学统计学STATISTICS分布函数的性质 1、单调不减性单调不减性:若:若x1x2, 则则F(x1) F(x2); 2、归一归一 性性:对任意实数:对任意实数x,0 F(x) 1,且,且 ; 1)(lim)(, 0)(lim)(xFFxFFxx)()(lim) 0(000 xFxFxFxx3、右连续性:对任意实数右连续性:对任意实数x,反之,具有上述三个性质的实函数,必是某个反之,具有上述三个性质的实函数,必是某个随机变
5、量的分布函数。故该三个性质是分布函随机变量的分布函数。故该三个性质是分布函数的充分必要性质数的充分必要性质。7统计学统计学STATISTICS解解 )(xFx0112)()(xXPxF试求出试求出X的分布函数的分布函数。.2, 1,21,7 .0, 10, 1 .0, 1,0 xxxx8统计学统计学STATISTICS连续型随机变量与概率密度连续型随机变量与概率密度, 0)( . 1xf, 1)( . 2dxxf有也可为也可为对于任意的,b,),(, ababa,)( . 3badxxfbXaP则称则称X是是连续型随机变量连续型随机变量,f(X)称为称为X的的概率密度函概率密度函数数, ,简称
6、概率密度简称概率密度。注意注意f(x)不是概不是概率率 设设X是随机变量,如果存在定义在整个实数轴上的函是随机变量,如果存在定义在整个实数轴上的函数数f(x),满足条件,满足条件9统计学统计学STATISTICS 概率密度函数的性质概率密度函数的性质1)0)( xf2) 1)(dxxfaSb 1xo)(xf这两条性质是判定一这两条性质是判定一个函数个函数 f(x)是否为某是否为某个随机变量个随机变量X的概率的概率密度函数的充要条件密度函数的充要条件3) X落入区间落入区间a,b内的概率内的概率 badxxf)(10统计学统计学STATISTICS连续型随机变量的期望和方差连续型随机变量的期望和
7、方差1. 连续型随机变量的数学期望连续型随机变量的数学期望2. 方差方差xxxfXEd)()(22d)()()(xxfXDXEx11统计学统计学STATISTICS3.2 正态分布正态分布(normal distribution)1.正态分布是最重要的一种正态分布是最重要的一种概率分布概率分布。正态分布。正态分布概念是由德国的数学家概念是由德国的数学家(Carl Friedrich Gauss,17771855)和天文学家和天文学家Moivre于于1733年首次年首次提出的,但由于提出的,但由于Gauss率先将其应用于天文学率先将其应用于天文学家研究,故正态分布又叫高斯分布。家研究,故正态分布
8、又叫高斯分布。2.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布3.许多现象都可以由正态分布来描述许多现象都可以由正态分布来描述 4.可用于可用于近似离散型随机变量的分布近似离散型随机变量的分布例如:例如: 二项分布当二项分布当n越来越大,越近似服从正态分越来越大,越近似服从正态分布布5.经典统计推断的基础经典统计推断的基础正态分布是许多统计方法的理论基础:正态分布是许多统计方法的理论基础:如如t分布、分布、F分布、分布、2分布都是在正态分分布都是在正态分布的基础上推导出来的,此外,布的基础上推导出来的,此外,t分布、分布、二项分布、二项分布、Poisson分布的极限为正态分
9、布的极限为正态分布,在一定条件下,可以按正态分布分布,在一定条件下,可以按正态分布原理来处理。原理来处理。 12统计学统计学STATISTICSxxfx,e21)(X22212的概率密度函数为如果随机变量 = 正态随机变量正态随机变量X的均值的均值 = 正态随机变量正态随机变量X的方差的方差 = 3.1415926; e = 2.71828x = 随机变量的取值随机变量的取值 (- x )则称则称X服从参数为服从参数为 、 的正态分布,记作的正态分布,记作XN( , )正态分布正态分布13统计学统计学STATISTICS正态分布函数的性质正态分布函数的性质1.图形是关于图形是关于x= 对称对称
10、钟形曲线,且峰值在钟形曲线,且峰值在x= 处处2.均值均值 和标准差和标准差 一旦确定,分布的具体形式也惟一确一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的定,不同参数正态分布构成一个完整的“正态分布族正态分布族” 3.均值均值 可取实数轴上的任意数值,决定正态曲线的具可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的体位置;标准差决定曲线的“陡峭陡峭”或或“扁平扁平”程度程度。 越大,正态曲线扁平;越大,正态曲线扁平; 越小,正态曲线越高陡峭越小,正态曲线越高陡峭4.当当X X的取值向横轴左右两个方向无限延伸时,曲线的的取值向横轴左右两个方向无限延伸时,曲线
11、的两个尾端也无限渐近横轴,两个尾端也无限渐近横轴,理论上永远不会与之相交理论上永远不会与之相交5.正态随机变量在特定区间上的取值概率由正态曲线下正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且的面积给出,而且其曲线下的总面积等于其曲线下的总面积等于1 14统计学统计学STATISTICS正态概率密度函数的几何特征正态概率密度函数的几何特征;)1(对称对称曲线关于曲线关于x ;21)(,)2(xfx取得最大值取得最大值时时当当 ; 0)(,)3(xfx时时当当;)4(处有拐点处有拐点曲线在曲线在x 15统计学统计学STATISTICS;,)(,)6(轴作平移变换轴作平移变换着着只是
12、沿只是沿图形的形状不变图形的形状不变的大小时的大小时改变改变当固定当固定xxf;)5(轴轴为为渐渐近近线线曲曲线线以以 x16统计学统计学STATISTICS.,)(,)7(图形越矮越胖图形越矮越胖越大越大图形越高越瘦图形越高越瘦越小越小而形状在改变而形状在改变不变不变图形的对称轴图形的对称轴的大小时的大小时改变改变当固定当固定xf17统计学统计学STATISTICS )1 , 0(2N)8 . 0 , 1(2N)2 . 1 , 1 (2N决定曲线的位置,决定曲线的位置,决定曲线的决定曲线的“胖瘦胖瘦”统计学统计学STATISTICS正态分布下的概率计算正态分布下的概率计算txFxtde21)
13、(222)( xXP ? 方法一方法一:利用统计软件计算利用统计软件计算方法二方法二:转化为转化为查表计算查表计算19统计学统计学STATISTICS).1, 0(,1, 0),(2NN记为记为态分布态分布的正态分布称为标准正的正态分布称为标准正这样这样时时中的中的当正态分布当正态分布 标准正态分布的概率密度表示为标准正态分布的概率密度表示为,e21)(22 xxx 标准正态分布的分布函数表示为标准正态分布的分布函数表示为xtxxt,de21)(22标准正态分布标准正态分布(standardize the normal distribution)(1)(xx xx20统计学统计学STATIST
14、ICS标准正态分布的图形标准正态分布的图形21统计学统计学STATISTICS查表标准正态分布函数表查表标准正态分布函数表.225. 1),1 , 0( XPNX求求已已知知解解225. 1 XP)25. 1()2( 8944. 09772. 0 例例1 .0828. 022统计学统计学STATISTICS解查标准正态分布表),5 . 02 . 0()1( XP),2 . 1()2( XP)34. 0|(|)( XP求设练习) 1 , 0( NX)5 . 02 . 0()( XP)2 . 0()5 . 0( 5793. 06915. 0 1122. 0 )2 . 1( )2 . 1()( XP
15、)2 . 1(1 1151. 08849. 01 1151. 0 34. 034. 0 XP)34.0|(|)( XP )34. 0()34. 0( )34. 0(1)34. 0( 16331. 02 1)34. 0(2 2662. 0 23统计学统计学STATISTICS正态分布的转换正态分布的转换1.任何一个任何一个一般的正态分布,可通过下面的线性一般的正态分布,可通过下面的线性变换转化为标准正态分布变换转化为标准正态分布)1 ,0( NXZX-表示将一般正态分布的曲线平衡到标准正态分布的位置表示将一般正态分布的曲线平衡到标准正态分布的位置除以除以表示将一般正态分布的曲线形状转换为标准正态
16、分布表示将一般正态分布的曲线形状转换为标准正态分布)()()( abbxaP)()( bbXP24统计学统计学STATISTICS正态分布正态分布(例题分析例题分析)02275. 097725. 01)2(1)105070(1)70(1)70(XPXP6826. 018413. 021) 1 (2) 1() 1 ()105040()105060()6040(XP25统计学统计学STATISTICS求设练习),60,500(2NX)( XP)1( XP解解 XP 6050056060500XP 605005601 )1(1 1587. 08413. 01 26统计学统计学STATISTICS27
17、统计学统计学STATISTICS简单随机抽样简单随机抽样(simple random sampling)1.从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个单位作为样本,使使得每一个总体单位都有相同的机会得每一个总体单位都有相同的机会( (概率概率) )被抽中被抽中 2.抽取元素的具体方法有抽取元素的具体方法有重复抽样和不重复抽样重复抽样和不重复抽样3.特点特点简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便但是当但是当N很大时,不易构造抽样框很大时,不易构
18、造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率也称纯随机抽样,是应用最多、也称纯随机抽样,是应用最多、最基本的抽样方法之一最基本的抽样方法之一28统计学统计学STATISTICS简单随机抽样的优缺点 优点:优点:简单随机抽样是最符合随机原则的简单随机抽样是最符合随机原则的抽样方法,能保证总体的每个成员具有已抽样方法,能保证总体的每个成员具有已知的且同等的被选为样本单位的机会,因知的且同等的被选为样本单位的机会,因此,产生的样本,不论其多大都是总体的此,产生的样本,不论其多大都是总体的一
19、个有效代表。一个有效代表。 缺点:缺点:不论使用哪种抽样方法,都需要预不论使用哪种抽样方法,都需要预先设定每个总体成员,要为每个总体成员先设定每个总体成员,要为每个总体成员提供一个标志值,而且要有一个完整的总提供一个标志值,而且要有一个完整的总体情况表,这往往是难以获得的。体情况表,这往往是难以获得的。29统计学统计学STATISTICS分层抽样分层抽样(stratified sampling)1. 将总体单位按某种特征或某种规则划分为将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机不同的层,然后从不同的层中独立、随机地抽取样本地抽取样本2. 优点优点保证样本的结构与总
20、体的结构比较相近,从保证样本的结构与总体的结构比较相近,从而提高估计的精度而提高估计的精度组织实施调查更方便组织实施调查更方便既可以对总体参数进行估计,也可以对各层既可以对总体参数进行估计,也可以对各层的目标量进行估计的目标量进行估计分层或分类时,应使层内各分层或分类时,应使层内各单位的差异尽可能小,而使单位的差异尽可能小,而使各层之间的差异尽可能大。各层之间的差异尽可能大。30统计学统计学STATISTICS系统抽样系统抽样(systematic sampling)1. 将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺按一定顺序排列,在规定的范围内随机地抽取一个序排列,在规定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 概率 分布 抽样
限制150内