抽样分布与参数估计.pptx
《抽样分布与参数估计.pptx》由会员分享,可在线阅读,更多相关《抽样分布与参数估计.pptx(120页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学1. 掌握随机试验、事件和概率的概念及性质掌握随机试验、事件和概率的概念及性质2. 理解随机变量及其分布,计算各种分布的理解随机变量及其分布,计算各种分布的概率概率3. 理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4. 掌握总体均值、总体比例和总体方差的区掌握总体均值、总体比例和总体方差的区间估计间估计概率基础概率基础随机变量及其分布随机变量及其分布 1.随即试验: 在相同条件下,对事物或现象所进行的观察 2.事件: 随机试验的每一个可能结果(任何样本点集合)1. 基本事件一个不可能再分的随机事件例如:掷一枚骰子出现的点数2. 样本空间一个试验中所有基本事件的集合,用表示例如
2、:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面1.事件的包含事件的包含2. 事件的并或和事件的并或和3. 事件的交或积事件的交或积4.互斥事件互斥事件5.事件的逆事件的逆6.事件的差事件的差 设A、B、C为三个事件,则有1. 交换律:AB=BA 2. AB=BA2. 结合律:A(BC)=(AB)C A(BC) =(AB) C3. 分配律:A(BC)=(AB)(AC) A(BC)=(AB)(AC)1. 事件A的概率是对事件A在试验中出现的可能性大小的一种度量2. 表示事件A出现可能性大小的数值3. 事件A的概率表示为P(A)4. 概率的定义有:古典定义、统计定义和主观
3、概率定义例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为nmAAP事件个数样本空间所包含的基本所包含的基本事件个数事件)(【例例】某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率某某钢铁公司所属企业职工人数钢铁公司所属企业职工人数工厂工厂男男职工职工女女职工职工合计合计炼钢厂炼钢厂炼铁厂炼
4、铁厂轧钢厂轧钢厂4000320090018001600600620048001500合计合计8500400012500 解:解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则68. 0125008500)(全公司职工总人数全公司男性职工人数AP384. 0125004800)(全公司职工总人数炼钢厂职工人数BP 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为pnmAP)(【例例】:某工
5、厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。 解:解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有4 . 03012)(试验的天数超过用电指标天数AP1.对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定2.概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断3.例如,我认为2001年的中国股市是一个盘整年1.非负性对任意事件A,有 0 P 12.规范性必然事件的概
6、率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 03.可加性若A与B互斥,则P ( AB ) = P ( A ) + P ( B )推广到多个两两互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )一一. 随机变量的概念随机变量的概念二.二.离散型随机变量的概率分布离散型随机变量的概率分布三.三.连续型随机变量的概率分布连续型随机变量的概率分布1. 一次试验的结果的数值性描述2. 一般用 X、Y、Z 来表示3. 例如: 投掷两枚硬币出现正面的数量4. 根据取值情况的不同分为离散型随机变量和连续型随机变量1
7、.随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1 , X2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查抽查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为男性为0,女性为女性为11.随机变量 X 取无限个值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验试验随机变量随机变量可能的取值
8、可能的取值抽查一批电子元件抽查一批电子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长度长度使用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 01.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn011niipX = xi0 1 2 3P(X=xi) pi0.05 0.10 0.55 0.301. 一个离散型随机变量X只取两个可能的值例如,男性用 1表示,女性用0表示;合格品用 1 表示,
9、不合格品用0表示2. 列出随机变量取这两个值的概率X = xi0 1P(X=xi)=pi0.05 0.951. 一个离散型随机变量取各个值的概率相同2. 列出随机变量取值及其取值的概率3. 例如,投掷一枚骰子,出现的点数及其出现各点的概率X = xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/61.在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和2.描述离散型随机变量取值的集中程度3.计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()()(111.随机变量X的每一个取值与期望值的离差平方和的
10、数学期望,记为D(X)2.描述离散型随机变量取值的分散程度3.计算公式为122)()()()(iiipXExXDXXEXEXD是离散型随机变量,则若X = xi1 2 3 4 5 6P(X =xi)=pi1/6 1/6 1/6 1/6 1/6 1/65 . 3616611)(61iiipxXE9167. 261)5 . 36(61)5 . 31 ()()(22612iiipXExXD超几何分布超几何分布离散型随机变离散型随机变量的概率分布量的概率分布泊松分布泊松分布二项分布二项分布指数分布指数分布连续型随机变连续型随机变量的概率分布量的概率分布正态分布正态分布均匀分布均匀分布其他分布其他分布1
11、. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值2. 它取任何一个特定的值的概率都等于03. 不能列出每一个值及其相应的概率4. 通常研究它取某一区间值的概率5. 用数学函数的形式和分布函数的形式来描述1. 设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件1d)()2(0)() 1 (xxfxf 密度函数 f(x)表示X 的所有取值 x 及其频数f(x) 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积baxxfbXaPd )()(xab1.连续型随机变量的概率也可以用分布函数F(x
12、)来表示2.分布函数定义为)(d)()()(xxttfxXPxF)()(d)()(aFbFxxfbXaPba1. 密度函数曲线下的面积等于12. 分布函数是曲线下小于 x0 的面积1. 连续型随机变量的数学期望为2. 方差为xxxfXEd)()(2d)()()(xxfXExXD 1. 描述连续型随机变量的最重要的分布 2. 可用于近似离散型随机变量的分布 例如: 二项分布 3. 经典统计推断的基础xxfx,e21)(2221f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828x = 随机变量的取值 (- x 02.正态曲线的最高点在均值,它也是分布的中位
13、数和众数3.正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。 决定曲线的高度,决定曲线的平缓程度,即宽度4.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总面积等于16.随机变量的概率由曲线下的面积给出xCAB?d)()(baxxfbxaP1. 一般的正态分布取决于均值和标准差 2. 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3. 若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表xxx,e21)(221.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布)1 ,0( NX
14、Zxtxttxxde21d)()(2-2XZ1.将一个一般的转换为标准正态分布2.计算概率时 ,查标准正态概率分布表3.对于负的 x ,可由 (-x) x得到4.对于标准正态分布,即XN(0,1),有P (a X b) b aP (|X| a) 2 a 15.对于一般正态分布,即XN( , ),有abbXaP)(12. 01052 . 6XZ5 = 102.97.1X21.1051 . 7 21.1059 . 2XZXZ0 = 1-.21Z.219525.0)67.1 (67.135351035)10(XPXPXP7938.0)1()67.1(67.1351351035352)102(XPXP
15、XP总体总体(Population):调查研究的事物或现象的全体个体个体(Item unit):组成总体的每个元素样本样本(Sample):从总体中所抽取的部分个体样本容量样本容量(Sample size):样本中所含个体的数量1.概率抽样:根据已知的概率选取样本 简单随机抽样:完全随机地抽选样本 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 整群抽样:将一组被调查者(群)作为一个抽样单位 等距抽样:在样本框中每隔一定距离抽选一个被调查者2.非概率抽样:不是完全按随机原则选取样本 非随机抽样:由调查人员自由选取被调查者 判断抽样:通过某些条件过滤来选择被调查者3.配额抽样:选择一群特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 参数估计
限制150内