(精品)第二、三讲地质统计学数理基础及基本术语.ppt
《(精品)第二、三讲地质统计学数理基础及基本术语.ppt》由会员分享,可在线阅读,更多相关《(精品)第二、三讲地质统计学数理基础及基本术语.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 地质统计学数理基础及基本术语地质统计学数理基础及基本术语一、概率论基础一、概率论基础 二、随机变量及其概率分布二、随机变量及其概率分布 三、随机变量的数字特征三、随机变量的数字特征四、统计推断基础四、统计推断基础 五、地质统计学的基本术语五、地质统计学的基本术语一、概率论基础一、概率论基础1、随机事件、随机事件 概率论是研究自然界偶然现象的科学,在概率论中把偶然现象称概率论是研究自然界偶然现象的科学,在概率论中把偶然现象称为为偶然事件偶然事件。在自然界,介于在自然界,介于“必然事件必然事件”和和“偶然事件偶然事件”之间的即是之间的即是“随随机事件机事件”。这类事件的特征是在一定条
2、件下可能发生,也可能不。这类事件的特征是在一定条件下可能发生,也可能不发生,或者在一定条件下有多个可能发生的结果,而其结果事先发生,或者在一定条件下有多个可能发生的结果,而其结果事先不能预测。不能预测。例如公共汽车站某一时刻乘客的人数,经典的硬币试例如公共汽车站某一时刻乘客的人数,经典的硬币试验结果等验结果等2、统计概率、统计概率 频频率率:设设随随机机事事件件A,在在n次次试试验验中中发发生生m次次,其其比比值值m/n称称为为随随机机事事件件A的的频率频率 显显然然 当当重重复复试试验验的的次次数数充充分分大大时时,随随机机事事件件A的的频频率率m/n常常常常稳稳定定在在一一个个确定的数字附
3、近,这个数字就是确定的数字附近,这个数字就是概率概率。概概率率:在在一一定定的的相相同同条条件件下下,重重复复作作n次次试试验验中中发发生生了了m次次,当当n充充分分大大时时,随随机机事事件件A的的频频率率m/n稳稳定定在在某某一一数数字字P附附近近,称称数数值值P为为该该随随机机事事件件的的概概率率。记为记为 P(A)=P性质性质 (1)0P(A)1 对于任意事件对于任意事件A,总有总有 (2)P(V)=0 V不可能事件不可能事件 (3)P(U)=1 U必然事件必然事件概率虽然是用频率来刻划的,但概率与频率是两个不同范畴的概念。随机事概率虽然是用频率来刻划的,但概率与频率是两个不同范畴的概念
4、。随机事件的频率与进行的试验次数有关,而概率则是随机事件本身的属性,与试验件的频率与进行的试验次数有关,而概率则是随机事件本身的属性,与试验次数是无关的。一般地说,当试验次数足够大时,频率可作为概率的近似值。次数是无关的。一般地说,当试验次数足够大时,频率可作为概率的近似值。3 3、古典型概率、古典型概率 古典概率是一类简单的随机现象,它具有如下特征:古典概率是一类简单的随机现象,它具有如下特征:1)1)在观测或试验中,它的全部可能结果为有限个,记作在观测或试验中,它的全部可能结果为有限个,记作E E1 1、E E2 2、E E3 3E En n,即即穷尽性穷尽性2)2)在在几几个个可可能能结
5、结果果中中,任任何何两两个个可可能能结结果果不不可可能能同同时时发发生生,即即这这些些事事件件是是两两两两互互不相容的,即不相容的,即互不相容性互不相容性。3)3)事件事件E E1 1、E E2 2、E E3 3E En n发生的可能概率相等,即发生的可能概率相等,即等概率性等概率性。4)4)在在n n个可能结果中,至少有一个结果发生,即个可能结果中,至少有一个结果发生,即必然性必然性。具备上述四种性质的事件群,称作完备群,组成完备群的事件叫具备上述四种性质的事件群,称作完备群,组成完备群的事件叫基本事件基本事件。若试验时某一基本事件的发生能导致随机事件若试验时某一基本事件的发生能导致随机事件
6、A的发生,则称这个基本事件有的发生,则称这个基本事件有利于随机事件利于随机事件A,在这种条件下求得的概率称在这种条件下求得的概率称条件概率条件概率 若以若以N个个互不相容且等可能性的事件构成的完备群代表试验得到的一切可能结互不相容且等可能性的事件构成的完备群代表试验得到的一切可能结果,其中果,其中M个事件有利于随机事件个事件有利于随机事件A,随机事件随机事件A的概率便等于有利的基本事件的概率便等于有利的基本事件数数M与基本事件的总数与基本事件的总数N的比值,即的比值,即4 4、概率的基本运算、概率的基本运算1 1)加)加:P(A+B)=P(A)+P(B)A:P(A+B)=P(A)+P(B)A、
7、B B互不相容互不相容 同理同理 P(AP(A1 1+A+A2 2+A+A3 3+An)=P(A+An)=P(A1 1)+P(A)+P(A2 2)+P(A)+P(A3 3)+)+P(A+P(An n)2)2)乘乘事事件件A A和和事事件件B B有有连连带带关关系系,即即在在事事件件B B已已发发生生的的条条件件下下,事事件件A A发发生生的的概率(带有附加条件的概率),记作概率(带有附加条件的概率),记作P P(A|BA|B)即即或或不带有附加条件的概率,即事件不带有附加条件的概率,即事件B B的发生不影响事件的发生不影响事件A A出现的概率,故出现的概率,故全概率公式全概率公式式式中中,PH
8、PHi i(i(i=1=1、2 2、3 3n)n)为为已已知知事事件件H Hi i的的概概率率,P P(A|HA|Hi i)为为事事件件A A在在H Hi i已已发生的条件下的条件概率;发生的条件下的条件概率;H Hi i事件两两互不相容,是样本空间的一个分割事件两两互不相容,是样本空间的一个分割甲甲、乙乙、丙丙三三个个钻钻井井队队施施工工,甲甲、乙乙、丙丙钻钻井井队队打打钻钻的的孔孔数数分分别别是是总总孔孔数数的的2020、3535、4545,其其见见矿矿率率分分别别是是3 3、2 2、1 1,问问从从总总钻钻孔孔中中任意指定一个钻孔的见矿概率是多少?任意指定一个钻孔的见矿概率是多少?解:设
9、解:设 H H1 1为为 甲用钻井队打钻的孔数甲用钻井队打钻的孔数 P(H P(H1 1)=0.20)=0.20 H H2 2为为 乙用钻井队打钻的孔数乙用钻井队打钻的孔数 P(H P(H2 2)=0.35)=0.35 H H3 3为为 丙用钻井队打钻的孔数丙用钻井队打钻的孔数 P(H P(H3 3)=0.45)=0.45 A A为为 钻孔见矿数钻孔见矿数 即即 P(A|HP(A|H1 1)=0.03 P(A|H)=0.03 P(A|H2 2)=0.02 P(A|H)=0.02 P(A|H3 3)=0.01)=0.01 由已知的简单事件的概率,推算出未知的复杂事件的概率,这就是全概率由已知的简
10、单事件的概率,推算出未知的复杂事件的概率,这就是全概率公式所起的作用公式所起的作用二、二、随机变量及其概率分布随机变量及其概率分布 随随机机变变量量是是基基本本事事件件的的函函数数,一一般般定定义义为为:根根据据随随机机实实验验的的结结果果而而取取得得不不同同数值的变量称作随机变量。一般用希腊字母数值的变量称作随机变量。一般用希腊字母、,表示。表示。随随机机变变量量可可分分为为离离散散型型的的和和连连续续型型的的两两种种。若若随随机机变变量量所所可可能能取取的的值值可可以以一一一一列列举举出出来来,即即是是有有限限的的,则则为为离离散散型型随随机机变变量量;若若随随机机变变量量所所可可能能取取
11、的的值不能一一列举出来,则称连续型随机变量。值不能一一列举出来,则称连续型随机变量。随随机机变变量量的的取取值值可可以以通通过过随随机机事事件件概概率率的的方方法法来来研研究究。从从概概率率角角度度出出发发,可可以给随机变量下一个更为科学的定义,即:以给随机变量下一个更为科学的定义,即:若若某某一一试试验验结结果果可可用用一一变变量量来来表表示示,依依这这两两种种不不同同类类型型的的随随机机变变量量,有有两两种情形:种情形:(1 1)若随机变量)若随机变量是离散型的,则任一取值有确定的概率是离散型的,则任一取值有确定的概率(2 2)若随机变量)若随机变量是是连续型的,则对任一实数,连续型的,则
12、对任一实数,XX有着确定的概率有着确定的概率此时则称此时则称为为一个随机变量一个随机变量由由定义可以看出,随机变量不仅需要给出它的取值范围,还需给出取值的概定义可以看出,随机变量不仅需要给出它的取值范围,还需给出取值的概率。率。把变量把变量可能取的值及其相应的概率称为随机变量的概率分布,也就是可能取的值及其相应的概率称为随机变量的概率分布,也就是随机函数随机函数1 1、离散型随机变量的概率分布、离散型随机变量的概率分布(1 1)伯努利实验和二点分布)伯努利实验和二点分布 只有两个可能结果的实验,称作伯努利实验只有两个可能结果的实验,称作伯努利实验 若随机变量的分布满足如下条件:若随机变量的分布
13、满足如下条件:则称则称服从二点分布(服从二点分布(P P为参数)为参数)二点分布又称作伯努利分布二点分布又称作伯努利分布二、二、随机变量及其概率分布随机变量及其概率分布(2 2)二项分布)二项分布若若在在相相同同的的条条件件下下进进行行n n次次独独立立试试验验,每每次次试试验验只只有有两两种种可可能能结结果果,成成功功或或失失败败,分分别别记记作作A A或或 ,那那么么在在n n次次试试验验中中事事件件A A出出现现的的次次数数是随机变量,是随机变量,服从于二项分布,出现服从于二项分布,出现K K次的概率为:次的概率为:(0P1,q=1-P)(0P0),0)则称则称服从泊松分布服从泊松分布式
14、中,式中,k k为指定的发生次数;为指定的发生次数;e e为自然对数的底,为自然对数的底,为参数为参数二、二、随机变量及其概率分布随机变量及其概率分布 2 2、连续连续型随机型随机变变量的概率分布量的概率分布(1 1)正态分布)正态分布 若随机变量若随机变量的概率密度为的概率密度为:(-x+)(-u+)(-x+)(-u00,有:有:其中其中S Sn n=1 1+2 2+n n,只要只要n n充分大,算术平均值充分大,算术平均值(S Sn n/n/n)接近于数接近于数学期望。通常把上式服从同一分布的随机变量数学期望。通常把上式服从同一分布的随机变量数1 1 ,2 2 ,n n 叫叫做服从大数定律
15、(或称弱大数定律)。若不考虑做服从大数定律(或称弱大数定律)。若不考虑D(D(k k)是否存在,只要是否存在,只要E E(k k)存在,上式亦存在,即存在,上式亦存在,即这时把服从同一分布的随机变量数列这时把服从同一分布的随机变量数列1 1 ,2 2 ,n n 称作服从强大称作服从强大数定律。数定律。大数定律揭示的规律是:只要大数定律揭示的规律是:只要n n充分大,观测结果算术平均值接近于数充分大,观测结果算术平均值接近于数学期望几乎是必然事件学期望几乎是必然事件2、中心极限定理、中心极限定理设设1 1 ,2 2 ,n n 是是独立同分布的随机变量数列,且独立同分布的随机变量数列,且E(E(k
16、 k)、D(D(k k)(k=1,2,(k=1,2,)存在存在 ,同时同时D(D(k k)不等于不等于0,0,一切实数一切实数abab,有有其中其中S Sn n=1 1+2 2+n n,于是于是因此上式可以写成因此上式可以写成该式该式表明,只要表明,只要n充分大,随机变量充分大,随机变量 便近似服从于标准正态分布。从而便近似服从于标准正态分布。从而 近似地服从正态分布。近似地服从正态分布。中心极限定理表明了不论原始数据的分布如何,当样本增加到一定数目时,样本平均中心极限定理表明了不论原始数据的分布如何,当样本增加到一定数目时,样本平均数的分布接近正态分布。即样本平均数的平均数等于总体平均数数的
17、分布接近正态分布。即样本平均数的平均数等于总体平均数 及样本平及样本平均数的方差等于总体方差除以样本大小均数的方差等于总体方差除以样本大小四、统计推断基础四、统计推断基础统计推断的基本思路是:从研究对象的全体中,抽取一小部分来进行观察统计推断的基本思路是:从研究对象的全体中,抽取一小部分来进行观察和研究,从而达到对全体(整体)进行推断的目的,所用的方法主要有参和研究,从而达到对全体(整体)进行推断的目的,所用的方法主要有参数估计和假设检验等方法。数估计和假设检验等方法。1、有关统计推断的几个基本概念、有关统计推断的几个基本概念总体:研究对象的全体总体:研究对象的全体样本:总体的一部分样本:总体
18、的一部分个体:组成总体的每个基本单元个体:组成总体的每个基本单元理论分布:总体的真实分布理论分布:总体的真实分布 (F(x)经验分布:样本的分布经验分布:样本的分布 (Fn*(x)2、总体与样本数字特征、总体与样本数字特征1、算术平均值、算术平均值2、几何平均值、几何平均值3、众数:对应于最大频数值的组中值,记为、众数:对应于最大频数值的组中值,记为M纵纵4、中位数:样本值按从大到小的顺序排列后,居于中间位置的样品、中位数:样本值按从大到小的顺序排列后,居于中间位置的样品 值,记为值,记为M中位中位5、方差:、方差:6、变异系数、变异系数7、极差、极差8、协方差、协方差9、相关系数、相关系数五
19、五 有关地质统计学的基本术语有关地质统计学的基本术语1)StatisticsStatistics is the science of collecting,processing,analyzing and interpreting numerical data.Statistics dilutes numerical information to provide(sometimes)clearer insights into a population.2)GeostatisticsGeostatistics originally started as the study of phenomen
20、on that vary in space,but the science has evolved as a suite of mathematical tools for application to many other earth science problems.The strength of Geostatistics is its stochastic approach to numerical modeling.Geostatistics,unlike statistics,focuses on natural phenomena which are correlated in
21、space.Typical features of importance are spatial continuity(or variability),spatial anisotropy,and trends.五五 有关地质统计学的基本术语有关地质统计学的基本术语3)VariableA variable is a symbol which can take any one of a prescribed set of values.A variable that can assume any real number value is called a continuous variable(
22、often denoted z in geostatistical jargon);any variable that can only assume an integer value is called a discrete or categorical variable.When a variable is distributed in space it is called a regionalized variable.五五 有关地质统计学的基本术语有关地质统计学的基本术语五五 有关地质统计学的基本术语有关地质统计学的基本术语4)Mean or Expected ValueThe mea
23、n,or Expected Value,is the weighted average of a random variable(or sample data),where the weights represent the probability of occurrence of each sample.If the sampling technique sampled unbiasedly,that is sampling without preference,the data all have an equiprobable chance of being selected and al
24、l of the probabilities would be one,i.e.the mean is then obtained by adding all of the data and dividing by the number of observations.五五 有关地质统计学的基本术语有关地质统计学的基本术语5)MedianThe midpoint of the ranked(i.e.sorted from smallest to largest)data.If there were 25 data,the median would be the 13th value.It al
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 第二 三讲 地质 统计学 数理 基础 基本 术语
限制150内