统计学概率与抽样分布38813.pptx
《统计学概率与抽样分布38813.pptx》由会员分享,可在线阅读,更多相关《统计学概率与抽样分布38813.pptx(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5章 概率与抽样分布Probability and Sampling Distributions想过下面的问题吗?l购买一张彩票中奖的可能性有多大?购买一张彩票中奖的可能性有多大?l购购买买一一只只股股票票明明天天上上涨涨的的可可能能性性有有多多大?大?l你你投投资资一一个个餐餐馆馆盈盈利利的的可可能能性性有有多多大大?l一项工程按期完成的可能性有多大?一项工程按期完成的可能性有多大?l明天降水的可能性有多大?明天降水的可能性有多大?第 5 章 概率与概率分布5.1 随机事件及其概率5.2 概率的性质与运算法则5.3 离散型随机变量及其分布5.4 连续型随机变量及其分布学习目标1.了解随机事
2、件、随机试验、含义、几种概率2.掌握随机变量的定义、分布特征及数学期望3.掌握样本均值与成数的抽样分布5.1 随机事件及其概率随机事件及其概率一一.事件及其运算事件及其运算二二.事件的概率事件的概率三三.概率计算的几个例子概率计算的几个例子事件及其运算事件的概念1.1.事事件件(event)(event):随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为32.2.随随机机事事件件(random(random event)event):每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数3.3.必必然然事事件件(certain(certain event)eve
3、nt):每次试验一定出现的事件,用表示例如:掷一枚骰子出现的点数小于74.4.不不可可能能事事件件(impossible(impossible event)event):每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6例解随机试验:抛掷两颗骰子,观察出现的点数试验的样本点和基本事件(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),.,(6,1),(6,2),.,(6,6随机事件A=“点数之和等于3”=(1,2),(2,1)B=“点数之和大于11”=6,6C=“点数之和不小于2”=D=“点数之和大于12”=事件的关系和运算(事件的包含)A AB B B B
4、A A 若事件A发生必然导致事件B发生,则称事件B包含事件A,或事件A包含于事件B,记作或 A B或 B A事件的关系和运算(事件的并或和)事件A和事件B中至少有一个发生的事件称为事件A与事件B 的并。它是由属于事件A或事件B的所有的样本点组成的集合,记为AB或A+BBA A A AB B事件的关系和运算(事件的交或积)A AB B A AB B 事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为BA 或AB事件的关系和运算(互斥事件)A AB B A A 与与与与 B B互不相容互不相容互不相容互不相容 事事件件A A与与事事件
5、件B B中中,若若有有一一个个发发生生,另另一一个个必必定定不不发发生生,则则称称事事件件A A与与事事件件B B是是互互斥斥的的,否否则则称称两两个个事事件件是是相相容容的的。显显然然,事事件件A A与与事事件件B B互互斥斥的的充充分分必必要要条件是事件条件是事件A A与事件与事件B B没有公共的样本点没有公共的样本点事件的关系和运算(事件的逆)A A A 一一个个事事件件B B与与事事件件A A互互斥斥,且且它它与与事事件件A A的的并并是是整整个个样样本本空空间间,则则称称事事件件B B是是事事件件A A的的逆逆事事件件。它它是是由由样样本本空空间间中中所所有有不不属属于于事事件件A
6、A的的样样本本点点所所组组成的集合,记为成的集合,记为 A A事件的关系和运算(事件的差)A A-B BAB B 事件A发生但事件B不发生的事件称为事件A与事件B的差,它是由属于事件A而不属于事件B的那些样本点构成的集合,记为A-B 什么是概率?(probability)1.1.概率是概率是对事件发生的可能性大小的度量对事件发生的可能性大小的度量你你购购买买一一只只股股票票明明天天上上涨涨的的可可能能性性有有多大多大明明天天降降水水的的概概率率是是80%80%。这这里里的的80%80%就就是是对对降降水水这这一一事事件件发发生生的的可可能能性性大大小小的一种数值度量的一种数值度量2.2.一个介
7、于一个介于0 0和和1 1之间的一个值之间的一个值3.3.事件事件A A的概率记为的概率记为P P(A A)事件的实际发生率事件的实际发生率称为称为频率频率。设在相同条。设在相同条件下,独立重复进行件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f/n n。概率概率:随机事件发生的可能性大小随机事件发生的可能性大小,用大,用大写的写的P P 表示;取值表示;取值0 0,1 1。一一、频率与概率、频率与概率frequency and frequency and probabilityprobability概率1.古典概率
8、是指在每次试验中事件等可能出现的条件下,于试验前计算的比率。设事件A是样本空间中的一个随机事件,若样本空间中的基本事件数为n,事件A包含m个基本事件,则事件A的概率为:P(A)=m/n【例】掷一枚的硬币,得到正面的概率为多少?2.2.试验概率试验概率是指在确定的条件下,事件是指在确定的条件下,事件A A在大量的在大量的n n次试验中出现次试验中出现m m次,则事件次,则事件A A的的频率频率 m/n m/n 可作为事件可作为事件A A的概率的概率 p p(A A)的近)的近似比率。这种概率是根据统计试验后的大似比率。这种概率是根据统计试验后的大量数据整理所得,故称试验概率,也称后量数据整理所得
9、,故称试验概率,也称后验概率和统计概率。记为:验概率和统计概率。记为:3.主观概率是指人们凭个人经验对某一事件发生的可能性大小作出的估计。例如,天空看上去阴沉沉的,估计下雨的可能性有多大;股价指数在未来一周内上升的可能性有多大;一种新产品在未来市场上畅销的可能性有多大等。1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 2.样本含量样本含量n越大,波动幅度越小,频率越接近概率。越大,波动幅度越小,频率越接近概率。频率与概率的关系:频率与概率的关系:表表 在相同条件下盲在相同条件下盲蝽蝽象在某棉田危害程度的象在某棉田危害程度的调查结调查结果果一一、频率与概率、频率与概率frequen
10、cy and frequency and probabilityprobability一一、频率与概率、频率与概率frequency and frequency and probabilityprobability 小概率原理小概率原理 若事件若事件A发生的概率较小,如小于发生的概率较小,如小于0.05或或0.01,则,则认为事件认为事件A在一次试验中不太可能发生,这称为小概在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称率事件实际不可能性原理,简称小概率原理小概率原理。这里。这里的的0.05或或0.01称为小概率标准,农业试验研究中通常称为小概率标准,农业试验研究中通常使用这
11、两个小概率标准。使用这两个小概率标准。二二、随机变量随机变量事先不知道会出现什么结果事先不知道会出现什么结果投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好一个消费者对某一特定品牌饮料的偏好 一般一般用用 X,Y,Z 来表示来表示根据取值情况的不同分为离散型随机变根据取值情况的不同分为离散型随机变量和连续型随机变量量和连
12、续型随机变量离散型和连续型离散型和连续型随机变量随机变量随机变量的可能取值是离散的数字,如计数型或分类随机变量的可能取值是离散的数字,如计数型或分类型等,称为离散型随机变量型等,称为离散型随机变量(discrete random discrete random variable)variable)。0,1,9 0,1,9。2020次实验中成功的次数,次实验中成功的次数,二项式分布。二项式分布。随机变量的可能取值是某一实数的区间,如随机变量的可能取值是某一实数的区间,如“大于大于0”0”或或“-22“-22之间之间”等,称为连续型随机变量等,称为连续型随机变量(continuous random
13、 variable)continuous random variable)。正态随机变量正态随机变量三三、随机变量随机变量三、离散型随机变量三、离散型随机变量(discrete random variables)1.随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1,x2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子离散型数学期望和方差(例题分析)【例例例例】一一一一家家家家电电电电脑脑脑脑配配配配件件件件供供供供应应应应商商商商声声声声称称称称,他他他他所所所所提提提提供供供供的的的的配配配配件件件件100100个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下
14、表个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表 每每每每100100100100个配件中的次品数及概率分布个配件中的次品数及概率分布个配件中的次品数及概率分布个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差求该供应商次品数的数学期望和标准差 三、离散型随机变量的概率分布三、离散型随机变量的概率分布列出离散型随机变量列出离散型随机变量X X的所有可能取值的所有可能取值列出随机变量取这些值的概率列出随机变量取这些值的概率通常用下面的表格来表示通常用下面的表格来表示P(X=xP(X=xi i)=p)=pi i称为离散型随机变量的概率函数称为离散型随机变量的概率函数连续型
15、随机变量连续型随机变量(continuous random variables)1.1.可以取一个或多个区间中任何值可以取一个或多个区间中任何值 2.2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出出来来,而而是是取取数数轴轴上上某某一区间内的任意点一区间内的任意点3.3.连续型随机变量的一些例子连续型随机变量的一些例子连续型随机变量的期望和方差1.1.连续型随机变量的期望值连续型随机变量的期望值 2.2.方差方差四、连续型随机变量的概率四、连续型随机变量的概率密度密度若观察资料数量够大,则直方图若观察资料数量够大,则直方图(组数适组数适当增加当增加)的整体的整体形形态可用一近似的平
16、滑态可用一近似的平滑曲线显示。曲线显示。直方图中纵轴改为次数比例,则该平滑直方图中纵轴改为次数比例,则该平滑曲线称为密度曲线曲线称为密度曲线(density curve)density curve)。概率密度曲线密度曲线的性质密度曲线的性质曲线都在水平线上曲线都在水平线上(密度函数密度函数=0)=0)。曲线下所涵盖的全部面积正好为曲线下所涵盖的全部面积正好为1(1(所有可能所有可能性为性为1)1)。曲线下任何范围所涵盖的面积,为观察值曲线下任何范围所涵盖的面积,为观察值落在该范围的比例落在该范围的比例(概率概率)。密度曲线可视为是观察变量的理论分密度曲线可视为是观察变量的理论分布布图图形。形。
17、四、连续型随机变量的概率四、连续型随机变量的概率密度密度随机变量随机变量X X的一切可能取值的完备组中,各的一切可能取值的完备组中,各可能取值可能取值xi xi与其相对应的概率与其相对应的概率pi pi乘积之和乘积之和描述随机变量取值的集中程度描述随机变量取值的集中程度计算公式为计算公式为五、随机变量的数学期望五、随机变量的数学期望随机变量随机变量X X的每一个取值与期望值的离的每一个取值与期望值的离差平方和的数学期望,记为差平方和的数学期望,记为D(X)D(X)描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度计算公式为计算公式为六、随机变量的方差六、随机变量的方差5.2 Th
18、e Binomial Distributions 二项分布二项分布(了解)(了解)一、一、二项分布设定二项分布设定The Binomial SettingThe Binomial Setting固定的观察次数固定的观察次数 n n。n n 次的观察都独立,每次的观察都不会对其次的观察都独立,每次的观察都不会对其他观察提供任何他观察提供任何信信息。息。每次的观察都只有两种可能的结果,多假每次的观察都只有两种可能的结果,多假设为设为“成功成功”或或“失败失败”两种。两种。每次的观察每次的观察“成功成功”的概率都一样,设定的概率都一样,设定为为 p p。二、二、二项分布二项分布Binomial Di
19、stributionBinomial Distribution满足二项分布设定的试验,以满足二项分布设定的试验,以 X X 记录记录 n n次观察次观察中中“成功成功”的次数,则称的次数,则称 X X 的分布为参数为的分布为参数为 n n 与与 p p 的二项分布的二项分布(binomial)binomial),记为记为B(n,p)B(n,p)。X X 的的所有可能取值所有可能取值为为0,1,0,1,nn。对应的概率函数为对应的概率函数为 P(X=x)=P(x)P(X=x)=P(x)。例例1 1 某种昆虫在某地区的死亡率为某种昆虫在某地区的死亡率为40%40%,即,即p p=0.4=0.4,现
20、对这种害虫用一种新药进行治疗试验,现对这种害虫用一种新药进行治疗试验,每次抽样每次抽样1010头作为一组治疗。试问如新药无疗效,头作为一组治疗。试问如新药无疗效,则在则在1010头中死头中死3 3头、头、2 2头、头、1 1头,以及全部愈好的概头,以及全部愈好的概率为多少?率为多少?按上述二项分布概率函数式计算按上述二项分布概率函数式计算 7头愈好,头愈好,3头死去概率:头死去概率:8头愈好,头愈好,2头死去概率:头死去概率:9头愈好,头愈好,1头死去概率:头死去概率:10头全部愈好的概率:头全部愈好的概率:【例】【例】若若问问10头中不超过头中不超过2头死去的概率为多少?头死去的概率为多少?
21、则应该应用累积函数,即则应该应用累积函数,即四、四、二项分布的期望值与标准差二项分布的期望值与标准差期望值:期望值:E(X)=np方差:方差:Var(X)=np(1-p)标准差:标准差:5.3 Normal Distributions 正态分布正态分布(掌握)(掌握)(连续型变量的概率分布)(连续型变量的概率分布)一、特点一、特点正正态曲线态曲线所有所有正正态曲线都有相同的外型态曲线都有相同的外型具有对称、单峰及钟形的特性。具有对称、单峰及钟形的特性。正正态曲线所代表的分态曲线所代表的分布布即为即为正态正态分分布布(normal distribution)normal distribution
22、)每一每一正正态分态分布布都有其平均值都有其平均值 与标准与标准差差 s s一、特点正正态曲线态曲线较大较大 s s一、特点一、特点正态曲线的拐点拐拐点落在点落在一个处拐拐点落在点落在-处处一、特点二二、P117P117规则规则正正态分态分布布有其特定的数据分布规则:有其特定的数据分布规则:平均值为平均值为,标准差为标准差为 的的正正态分态分布布68%68%的观察资料落在的观察资料落在 的的 1 1 之内之内95%95%的观察资料落在的观察资料落在 的的 2 2 之内之内99.7%99.7%的观察资料落在的观察资料落在 的的 3 3 之内之内0123-1-2-3mm+sm+2sm+3sm-sm
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 概率 抽样 分布 38813
限制150内