概率和统计基础.ppt
《概率和统计基础.ppt》由会员分享,可在线阅读,更多相关《概率和统计基础.ppt(98页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于概率与统计基础第一张,PPT共九十八页,创作于2022年6月 一一 随机变量与分布函数随机变量与分布函数1、随机试验随机试验满足条件满足条件:(1 1)可在相同的条件下可在相同的条件下重复重复进行;进行;(2 2)试验结果不止一个)试验结果不止一个,但事先能明确所有的结果;但事先能明确所有的结果;(3 3)试验前不能预知哪一个结果出现的实验称为随机实验。试验前不能预知哪一个结果出现的实验称为随机实验。用用 E E 表示。表示。2、样本空间样本空间随机试验随机试验E E 所有可能的结果所有可能的结果组成的集合称为样本空间记为组成的集合称为样本空间记为=e试验的每试验的每个可能结果称为样本点。
2、个可能结果称为样本点。3、随机事件随机事件满足某些条件的样本点所组成的集合(为满足某些条件的样本点所组成的集合(为 的子集)的子集),常用大写字母常用大写字母A A、B B、C C表示,表示,组成随机事件的一个样本点发生称为随机事件发生。组成随机事件的一个样本点发生称为随机事件发生。第二张,PPT共九十八页,创作于2022年6月2例例1 1:E E1 1随机试验随机试验:抛一枚硬币,观察正面、反面了出现的情况。抛一枚硬币,观察正面、反面了出现的情况。样本空间样本空间 1 1:HH,TT;E E:将一枚硬币抛掷三次,观察正面将一枚硬币抛掷三次,观察正面H H、反面、反面T T出现的情况。出现的情
3、况。2 2:HHHHHH,HHTHHT,HTHHTH,THHTHH,HTTHTT,THTTHT,TTHTTH,TTTTTT;E E:将一枚硬币抛掷三次,观察出现正面的次数。将一枚硬币抛掷三次,观察出现正面的次数。3 3:00,1 1,2 2,33;E E:抛一颗骰子,观察出现的点数。抛一颗骰子,观察出现的点数。4 4:1 1,2 2,3 3,4 4,5 5,66;E E:记录某城市记录某城市120120急救电话台一昼夜接到的呼唤次数。急救电话台一昼夜接到的呼唤次数。5 5:00,l l,2 2,3 3,;E E:在一批灯泡中任意抽取一只,测试它的寿命。在一批灯泡中任意抽取一只,测试它的寿命。6
4、 6:t tt0t0;E E:记录某地一昼夜的最高温度和最低温度。记录某地一昼夜的最高温度和最低温度。7 7:(x,y)T T0 0 xyTT1 1,这里这里x示最低温度,示最低温度,y表示最高温度,表示最高温度,并设这一地区的温度不会小于并设这一地区的温度不会小于T To o,也不会大于,也不会大于T T1 1。第三张,PPT共九十八页,创作于2022年6月3在相同的条件下,进行了在相同的条件下,进行了n n次试验,在这次试验,在这n n次试验中,事件次试验中,事件A A发生的发生的次数次数n nA A称为事件称为事件A A发生的频数。比值发生的频数。比值n nA A n n称为事件称为事件
5、A A发生的频率,并记发生的频率,并记成成n n(A)(A)。4 4 概率概率对于一个随机事件对于一个随机事件A(A(除必然事件和不可能事件外除必然事件和不可能事件外)来说,它在一次来说,它在一次试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生的可能性。的可能性。用一个数用一个数P(A)P(A)来表示该事件发生的可能性大小,这个数来表示该事件发生的可能性大小,这个数P(A)P(A)就称为随就称为随机事件机事件A A的概率。的概率。我们希望找到一个数来表示我们希望找到一个数来表示P(A)P(A)。严格定义应用公理
6、化三条件非负性、归一性和可列可加性。严格定义应用公理化三条件非负性、归一性和可列可加性。频率频率当当n n足够大时,足够大时,n(A)P(A)第四张,PPT共九十八页,创作于2022年6月4 5、随机变量随机变量是定义在样本空间记是定义在样本空间记上的一个单值上的一个单值函数,用来表示随机现函数,用来表示随机现象的结果的变量象的结果的变量。常用大写字母X、Y表示,随机变量的取值具有随机性,随机变量的取值有一定的概率(按一定的概率取某个值某个值 )。样本空间上可以定义多个随机变量。随机变量分为离散和连续随机变量。用掷硬币用掷硬币10次来说明上述概念次来说明上述概念掷硬币为随机实验,掷硬币为随机实
7、验,=正面,反面正面,反面为样本空间为样本空间.正面朝上的次数可以定义为随机变量。正面朝上的次数可以定义为随机变量。6 6次正面朝上一个随机事件次正面朝上一个随机事件A A。在所有的实验中,出现在所有的实验中,出现6次朝上事件的频率为次朝上事件的频率为A A 的概率的概率也可以将硬币朝向作为随机变量也可以将硬币朝向作为随机变量X:正面朝上:正面朝上X=1=1,否则,否则X=0=0第五张,PPT共九十八页,创作于2022年6月5概率的重要性质概率的重要性质第六张,PPT共九十八页,创作于2022年6月6概率的重要性质概率的重要性质第七张,PPT共九十八页,创作于2022年6月76、条件概率、条件
8、概率 在事件在事件A A 发生的条件下事件发生的条件下事件B B 发生的概率称为发生的概率称为条件概率条件概率,记为记为满足可列可加性:设满足可列可加性:设B1,B2,两两互不相容的事件,即对于两两互不相容的事件,即对于ij,BiBj=,i,j=1,2,则有则有第八张,PPT共九十八页,创作于2022年6月8B1BnAB1AB2ABn全概率公式ABayes公式全概率公式与全概率公式与Bayes 公式公式B2第九张,PPT共九十八页,创作于2022年6月9 6 一维随机变量分布函数一维随机变量分布函数对于离散的对于离散的 随机变量随机变量X,x1,x2,xk是X的所有取值,则X的概率的概率分布列
9、分布列(也称概率分布)为:(也称概率分布)为:设 X为随机变量,则对于任意实数x称为X 的分布函数,对离散型随机变量,采用累加的方法求其分布函数,有公式:Xx1x2xkp pp(p(x1)p(p(xk)第十张,PPT共九十八页,创作于2022年6月10 对连续型随机变量,其分布函数公式:非负可积函数 是它的概率密度函数右图几何意义,F(x)为阴影部分的面积yyxF(x)x第十一张,PPT共九十八页,创作于2022年6月11分布函数的性质分布函数的性质l F(x)单调不减,即l且l F(x)右连续,即第十二张,PPT共九十八页,创作于2022年6月12 7 二维随机变量的分布函数二维随机变量的分
10、布函数设设(X,Y)为二维为二维随机变量,(x,y)为任一对实数,称函数称为二维随机变量称为二维随机变量(X,Y)的分布函数,也称为的分布函数,也称为X X和和Y Y的联合分布函数的联合分布函数,对离散型随机变量,其联合分布函数公式:对连续型随机变量,其联合分布函数公式:定义函数:为X关于Y的边缘分布函数,同理第十三张,PPT共九十八页,创作于2022年6月13对离散型随机变量,称对连续型随机变量,关于X和关于Y的边缘概率密度为:8、条件概率函数关于X的边缘分布律为为变量(X,Y)的联合概率分布,也称变量变量(X,Y)的联合分布的联合分布律同样关于Y的的边缘分布律对离散型随机变量(X,Y),称
11、为在为在 X=xi 的条件下的条件下,Y 的条件分布律的条件分布律第十四张,PPT共九十八页,创作于2022年6月14对连续型随机变量(X,Y),在在X=x的条件下的条件下Y 的条件概率密度为的条件概率密度为在在Y=y的条件下的条件下X的条件概率密度的条件概率密度在在Y=y的条件下的条件下X的的条件分布函数条件分布函数在在X=x的条件下的条件下Y 的条件分布函数的条件分布函数第十五张,PPT共九十八页,创作于2022年6月159、相互独立的随机变量相互独立的随机变量 设设(X,Y)为二维为二维随机变量随机变量,对于任意实数 x,y,有有则称随机变量则称随机变量 X 和和Y 是相互独立的是相互独
12、立的X 和和Y 是相互独立是相互独立随机变量与下列条件等价随机变量与下列条件等价对于连续的随机变量,对于连续的随机变量,X 和和Y 是相互独立是相互独立与下列条件等价与下列条件等价如果二维如果二维随机变量随机变量(X,Y)相互独立,则有的相互独立,则有的第十六张,PPT共九十八页,创作于2022年6月16 二二 随机变量的数字特征随机变量的数字特征1.一维随机变量一维随机变量数学期望对连续型随机变量,其数学期望公式:对离散型随机变量,其数学期望公式:其中2.一维随机变量一维随机变量方差随机变量X 的方差为方差为Var(X)=D(X)=E X-E(X)2称为均方差与标准差方差与标准差第十七张,P
13、PT共九十八页,创作于2022年6月17对连续型随机变量,其方差公式:对离散型随机变量,其方差公式:有公式第十八张,PPT共九十八页,创作于2022年6月18设设(X,Y)为二维为二维随机变量,对离散型随机变量,其数学期望为:3 3 二维随机变量的数字特征:二维随机变量的数字特征:对连续型随机变量,其数学期望为:离散和连续型随机变量的方差为:第十九张,PPT共九十八页,创作于2022年6月19数学期望和方差的性质:如果如果X 和和Y 是相互独立是相互独立随机变量,则有随机变量,则有对于对于n n个独立的个独立的随机变量,有随机变量,有第二十张,PPT共九十八页,创作于2022年6月20随机变量
14、随机变量X和和 Y 的协方差为的协方差为:4 4 协方差与相关系数:协方差与相关系数:离散和连续型随机变量的协方差表达式为离散和连续型随机变量的协方差表达式为:协方差性质协方差性质a,b为任意常数任意常数如果如果X 和和Y 是相互独立,则是相互独立,则第二十一张,PPT共九十八页,创作于2022年6月21为为X和和 Y 的相关系数的相关系数相关系数:相关系数:即存在常数a 和b,a0,使得P(Y=aX+b)=1无量纲的量相关系数的性质相关系数的性质2)若)若则则X和和Y 不相关不相关(线性线性)1)3)若)若则X和Y完全线性相关,既(X,Y)的协方差矩阵为:)的协方差矩阵为:第二十二张,PPT
15、共九十八页,创作于2022年6月225.偏度与峰度偏度与峰度X 的k阶原点矩X 的k阶中心矩偏度(偏度(偏度(偏度(SkewnessSkewness)公式如下公式如下峰度(峰度(峰度(峰度(KurtosisKurtosis)公式如下公式如下偏度衡量偏度衡量偏度衡量偏度衡量X X围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度围绕均值是否对称,峰度衡量凸起或平坦程度S0S0表示右偏(右拖尾),表示右偏(右拖尾),表示右偏(右拖尾),表示右偏(右拖尾),S0S3K3,凸起大于正态分布,凸起大于正态分布,凸起大于正态分布,凸起大
16、于正态分布,K3 K x)=P(X2性质性质2 2:的点的点 为为F F分布的上分布的上 分位点分位点.F 分布的分布的 分位点。设分位点。设 称称F F分布的上分布的上 分位点分位点图形如右图形如右图图.可以通过查表得到可以通过查表得到第三十六张,PPT共九十八页,创作于2022年6月36 在统计学中在统计学中,将我们研究的问题所涉及的对象的全体将我们研究的问题所涉及的对象的全体称为称为总体总体,而把总体中的每个成员称为而把总体中的每个成员称为个体个体.例如例如:我们想要研究一家工厂的某种产品的废品率我们想要研究一家工厂的某种产品的废品率.这种产品的这种产品的全体就是我们的总体全体就是我们的
17、总体,而每件产品则是个体而每件产品则是个体.从总体中抽取的一部分个体,称为总体的从总体中抽取的一部分个体,称为总体的一个样本一个样本;样本中;样本中个体的个数称为个体的个数称为样本的容量样本的容量。X1,X2,Xn 称为从总体称为从总体X X得到的容量为得到的容量为n n的随机样本,简称样本。一次具的随机样本,简称样本。一次具体的抽取记录体的抽取记录 x1,x2,xn是随机变量,是随机变量,X1,X2,Xn的一个观察值的一个观察值,成为成为样本值样本值定义:来自总体定义:来自总体X X的样本的样本X1,X2,Xn的函数的函数g(X1,X2,Xn),若是连若是连续的且不含任何未知参数,则称为一个
18、统计量续的且不含任何未知参数,则称为一个统计量四、样本与抽样四、样本与抽样总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值第三十七张,PPT共九十八页,创作于2022年6月37统计量统计量1、常用的统计量、常用的统计量设设X1,X2,Xn是是来自总体来自总体X的一个样本,的一个样本,x1,x2,xn 是这一样本的观测是这一样本的观测值,定义值,定义(1)样本均值样本均值(2)样本方差样本方差样本标准差样本标准差第三十八张,PPT共九十八页,创作于2022年6月38常用的统计量常用的统计量(3)(3)样本样本 k k 阶原点矩阶原点矩(4)(4)样本样本 k k 阶中心矩阶中
19、心矩并称他们相应的观测值并称他们相应的观测值 k=1,2,仍分别为仍分别为:样本均值、样本方差、样本标准差、样本样本均值、样本方差、样本标准差、样本 k k 阶原点矩、样本阶原点矩、样本 k k 阶中心矩阶中心矩.第三十九张,PPT共九十八页,创作于2022年6月392 2、常用统计量的性质、常用统计量的性质设设X1,X2,Xn是是来自总体来自总体X的容量为的容量为n n一个样本,一个样本,若若 X 有期望有期望 EX=和方差和方差var(var(X)=DX=2,如果样本的二阶矩存在,则有如果样本的二阶矩存在,则有2)1)第四十张,PPT共九十八页,创作于2022年6月403 3、正态总体的样
20、本均值与样本方差的分布、正态总体的样本均值与样本方差的分布2)前面证明的性质)前面证明的性质1 EX=,var(var(X)=DX=2,可得,可得,(1)和()和(3)证)证明比较复杂,(见浙江大学概率论与数理统计明比较复杂,(见浙江大学概率论与数理统计P172,通过做正交变化降通过做正交变化降阶阶)第四十一张,PPT共九十八页,创作于2022年6月413 3、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布证明:由性质证明:由性质2 ,由性质由性质3 3根据根据t分布的定义分布的定义第四十二张,PPT共九十八页,创作于2022年6月42两个正态总体样本的抽样分布两个正态
21、总体样本的抽样分布的相互独立的相互独立的简单随机样本的简单随机样本.设与分别是来分别是来自正态总体自正态总体与设分别是两个样本的均值分别是两个样本的均值是两个样本的方差是两个样本的方差则有则有当当时时定理定理3 3第四十三张,PPT共九十八页,创作于2022年6月43参数估计总体分布的总体分布的未知参数未知参数的估计的估计总体分布的参数往往是未知总体分布的参数往往是未知的的,需要通过样本来估计需要通过样本来估计.通过样本来估计总体的参数通过样本来估计总体的参数,称为称为参数估计参数估计,它是统计推断的一种重要形式它是统计推断的一种重要形式.参数估计问题的一般提法参数估计问题的一般提法X1,X2
22、,Xn要依据该样本对参数要依据该样本对参数 作出估计,或估计作出估计,或估计的某个已知函数的某个已知函数 。这类问题称为。这类问题称为参数估计。参数估计。设有一个统计总体,总体的分布函数设有一个统计总体,总体的分布函数为为 F(x,)其中其中 为未知参数为未知参数(可以是向量可以是向量)现从该总体抽样,得现从该总体抽样,得样本样本第四十四张,PPT共九十八页,创作于2022年6月44点估计1.1.矩估计法矩估计法 用样本炬替代总体炬用样本炬替代总体炬2.2.极大似然法极大似然法3.3.最小二乘法最小二乘法第四十五张,PPT共九十八页,创作于2022年6月45估计量的评选标准估计量的评选标准(1
23、)无偏性)无偏性(2)有效性)有效性(3)一致性)一致性第四十六张,PPT共九十八页,创作于2022年6月假设假设检验检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布未知时的总体分布未知时的假设检验问题假设检验问题 在在本本讲讲中中,我我们们将将讨讨论论不不同同于于参参数数估估计计的的另另一一类类重重要要的的统统计计推推断断问问题题.这这就就是是根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个假假设设是是否否正正确确.这这类类问问题题称称作假设检验问题作假设检验问题 .五、假设检验五、假设检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检
24、验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验总体分布已知,总体分布已知,检验关于未知参数检验关于未知参数的某个假设的某个假设1.假设检验的原理第四十七张,PPT共九十八页,创作于2022年6月47 假设检验的两类错误假设检验的两类错误P拒绝拒绝H0|H0为真为真=,P接受接受H0|H0不真不真=.犯两类错误的概率犯两类错误的概率:显著性水平显著性水平 为犯第一类错误的概率为犯第一类错误的概率.H0为真为真实际情况实际情况决定决定拒绝拒绝H0接受接受H0H0不真不真第一类错误第一类错误正确正确正确正确第二类错误第二类错误通常控制犯第一类错误的概率通常控制犯第一类错误的概
25、率.一般事先选定一个数一般事先选定一个数,(0,(0 1),1),要求要求犯犯第一类错误的概率第一类错误的概率.,.,为假设检验的显著性水平,为假设检验的显著性水平,通常只讨论犯第通常只讨论犯第一类错误的概率一类错误的概率第四十八张,PPT共九十八页,创作于2022年6月481.假设检验的步骤(1)提出二择一的假设提出二择一的假设H H0 0(往往与试验目的相反)与(往往与试验目的相反)与H H1 1(往往是欲得到的结论)往往是欲得到的结论);(2 2)给定显著水平(小概率)给定显著水平(小概率 ););(3 3)在)在H H0 0成立下,收集数据,寻找检验统计量(如正态成立下,收集数据,寻找
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 基础
限制150内