心理与教育统计学第6章 概率分布.ppt
《心理与教育统计学第6章 概率分布.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章 概率分布.ppt(143页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、心理与教育统计学心理与教育统计学第第6章章 概率分布概率分布6.1 概率的基本概念概率的基本概念6.2 二项分布二项分布6.3 正态分布正态分布6.4 样本分布样本分布6.1 概率的基本概念概率的基本概念在个别试验中其结果呈现出不确定性,在在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛的现象,称为随机现象。例如掷硬币、抛骰子等骰子等概率论与数理统计是研究和揭示随机现象概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。统计规律性的一门数学学科。6.1.1 什么是概率什么是概率随机事件的随
2、机事件的频率频率 当当n无限增大时,随机事件无限增大时,随机事件A的频率会的频率会稳定在一个常数稳定在一个常数P,这个常数就是随机事,这个常数就是随机事件件A的的概率概率。(一)后验概率(或统计概率)(一)后验概率(或统计概率)(6.1)(6.2)观察随机事件观察随机事件A出现的次数的方式来出现的次数的方式来决定决定A的概率,称为后验概率。的概率,称为后验概率。(二)先验概率(古典概率)(二)先验概率(古典概率)古典概率模型要求满足两个条件:古典概率模型要求满足两个条件:试验的所有可能结果(或基本事件)试验的所有可能结果(或基本事件)是有限的;是有限的;每一种基本事件出现的可能性相等。每一种基
3、本事件出现的可能性相等。n为基本事件的总数;为基本事件的总数;m为事件为事件A包含的基本事件的数目。包含的基本事件的数目。(6.3)在事件在事件A发生之前,可以通过计算确发生之前,可以通过计算确定的概率,称为先验概率。定的概率,称为先验概率。Dewey.G统计了约统计了约438023个字母,得个字母,得到的英语中特定字母的频率到的英语中特定字母的频率字母字母频率频率字母字母频率频率字母字母频率频率E E0.12680.1268L L0.03940.0394P P0.01860.0186T T0.09780.0978D D0.03890.0389B B0.01560.0156A A0.07880
4、.0788U U0.0280.028V V0.01020.0102O O0.07760.0776C C0.02680.0268K K0.0060.006I I0.07070.0707F F0.02560.0256X X0.00160.0016N N0.07060.0706M M0.02440.0244J J0.0010.001S S0.06340.0634W W0.02140.0214Q Q0.00090.0009R R0.05940.0594Y Y0.02020.0202Z Z0.00060.0006H H0.05730.0573G G0.01870.0187历史上的投掷硬币试验历史上的投掷
5、硬币试验 实验者实验者投掷投掷次数次数正面向上正面向上的次数的次数频率频率德摩根德摩根20482048106110610.51810.5181蒲丰蒲丰40404040204820480.50690.5069K.K.皮尔逊皮尔逊1200012000601960190.50160.5016K.K.皮尔逊皮尔逊240002400012012120120.50050.5005 投掷硬币的概率是统计概率与古投掷硬币的概率是统计概率与古典概率?典概率?6.1.2 概率的基本性质概率的基本性质1任何随机事件任何随机事件的概率都是在的概率都是在0与与1之间的正数,即之间的正数,即:0 P(A)12不可能事件不
6、可能事件的概率等于零,即的概率等于零,即:P(A)=0 3必然事件必然事件的概率等于的概率等于1,即,即:P(A)=1(一)概率的公理系统(一)概率的公理系统(二)概率的加法定理(二)概率的加法定理 若事件发生,则事件就一定不若事件发生,则事件就一定不发生,这样的两个事件为发生,这样的两个事件为互不相容事互不相容事件件。两互不相容事件和的概率,等于这两互不相容事件和的概率,等于这两个事件概率之和,即两个事件概率之和,即(6.4a)(6.4b)(三)概率的乘法定理(三)概率的乘法定理 若事件发生不影响事件是否发生,若事件发生不影响事件是否发生,这样的两个事件为这样的两个事件为互相独立事件互相独立
7、事件。两个互相独立事件同时出现的概率,两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即等于这两个事件概率的乘积,即(6.5a)(6.5b)例:某一学生从个试题中任意抽取例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的一题,进行口试。如果抽到每一题的概率为概率为15,则抽到试题或试题,则抽到试题或试题的概率是多少?的概率是多少?如果前一个学生把抽如果前一个学生把抽过的试题还回后,后一个学生再抽,过的试题还回后,后一个学生再抽,则个学生都抽到试题则个学生都抽到试题1的概率是多少的概率是多少?该学生抽到试题该学生抽到试题1或者试题或者试题2为不相为不相容事件:容事件:四个学
8、生均抽到试题四个学生均抽到试题1为独立事件:为独立事件:例:一个口袋装有例:一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红球,从袋中取球两次。只红球,从袋中取球两次。考虑两次取球方式考虑两次取球方式(a)放回抽样,第一次)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一只球,观察其颜色后放回,搅匀后再取一球。(取一球。(b)不放回抽样,第一次取一球)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一不放回袋中,第二次从剩余的球中再取一球。球。请问这两种情况下取到一只白球和一只红请问这两种情况下取到一只白球和一只红球的概率。球的概率。放回取样放回取样第一次取到白球,
9、第二次取到红球:第一次取到白球,第二次取到红球:第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球:取到一只白球和一只红球的概率:取到一只白球和一只红球的概率:不放回取样不放回取样 第一次取到白球,第二次取到红球:第一次取到白球,第二次取到红球:第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球:取到一只白球和一只红球的概率:取到一只白球和一只红球的概率:问题:小明的班上有问题:小明的班上有83名同学,至少有名同学,至少有一位同学与小明的生日相同的概率?一位同学与小明的生日相同的概率?(一年按(一年按365天计算)天计算)82名同学与小明的生日均不相同的概率为:名同学与
10、小明的生日均不相同的概率为:至少一位同学与小明的生日相同的概率为:至少一位同学与小明的生日相同的概率为:n n202023233030404050506464100100p p0.4110.411 0.5070.507 0.7060.706 0.8910.8910.970.970.9970.9971 1问题:问题:83人的班上,至少两人生日相人的班上,至少两人生日相同的概率为多少?同的概率为多少?“与小明生日相同与小明生日相同的概率的概率”与与“班班级人数级人数”的关系的关系“至少两人生日相至少两人生日相同的概率同的概率”与与“班级人数班级人数”的关的关系系人数人数概概率率人数人数概概率率小明
11、的小组有小明的小组有6人,(人,(1)有人与小明出生)有人与小明出生月份相同的概率为多少?(月份相同的概率为多少?(2)至少)至少2人出人出生月份相同的概率为多少?生月份相同的概率为多少?信不信?可以试一试!信不信?可以试一试!(1)(2)6.1.3 概率分布类型概率分布类型概率分布是指对随机变量取不同值时的概概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。率的描述,一般用概率分布函数进行描述。概率分布概率分布是总体的分布,而是总体的分布,而频率分布频率分布是样是样本的分布。本的分布。概率概率给出的是单个结果发生的可能性,给出的是单个结果发生的可能性,概概率分布率分布
12、是对随机变量所有可能结果的可能是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形性分布描述,通常可以写成某个函数式形式。式。分分组组区区间间组组中中值值人数人数频频率率频频率密度率密度18018110.010.003317717830.040.013317417550.060.020017117230.040.013316816950.060.020016516670.080.0267162163150.180.0600159160180.220.0733156157140.170.056715315490.110.036715015130.040.0133学生身高次数分布表学
13、生身高次数分布表 次数次数 频率频率 频率密度频率密度 150 159 168 177 150 159 168 177 150 159 168 177151 160 169 178 151 160 169 178 151 160 169 178 学生身高次数分布图学生身高次数分布图 全国学生身高概率分布图全国学生身高概率分布图 151 160 169 178 151 160 169 178 概率概率 概率密度概率密度 概率分布中的曲线高度一般为概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值;面积表示概率,横坐标为样本值;有少数情况下,曲线高度表示概率(如有少数情况下
14、,曲线高度表示概率(如P179二项分布)。二项分布)。(一)离散分布与连续分布(一)离散分布与连续分布依随机变量的类型,可将概率分布分为离依随机变量的类型,可将概率分布分为离散分布与连续分布。散分布与连续分布。当随机变量只取孤立的数值时,这种随机当随机变量只取孤立的数值时,这种随机变量称为离散随机变量,离散随机变量的变量称为离散随机变量,离散随机变量的概率分布称为离散分布。概率分布称为离散分布。连续随机变量的概率分布称为连续分布。连续随机变量的概率分布称为连续分布。心理与教育统计学中最常用的离散型分布心理与教育统计学中最常用的离散型分布是是二项分布二项分布,最常用的连续型分布是,最常用的连续型
15、分布是正态正态分布分布。(二)经验分布与理论分布(二)经验分布与理论分布依分布函数的来源,可将概率分布分为经依分布函数的来源,可将概率分布分为经验分布与理论分布。验分布与理论分布。经验分布是指根据观察或实验所获得的数经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。布往往是总体的一个样本。理论分布有两个含义,一是随机变量概率理论分布有两个含义,一是随机变量概率分布的函数(如分布的函数(如正态分布正态分布),二是按某种),二是按某种数学模型计算出的总体的次数分布(如数学模型计算出的总体的次数分布(如二二项分布项分布
16、)。)。(三)基本随机变量分布与抽样分(三)基本随机变量分布与抽样分布布依所描述的数据的样本特性,可将概率分依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取基本随机变量分布是随机变量各种不同取值情况的概率分布,如二项分布与正态分值情况的概率分布,如二项分布与正态分布。布。抽样分布是从同一总体内抽取的不同抽样分布是从同一总体内抽取的不同样本样本的统计量的统计量的概率分布,如平均数分布,方的概率分布,如平均数分布,方差分布,相关系数分布等。差分布,相关系数分布等。谢谢!谢谢!复习复习l古典概率与统计概率古典
17、概率与统计概率加法原理:加法原理:乘法原理:乘法原理:l频率与概率频率与概率l频率分布与概率分布频率分布与概率分布6.2 二项分布二项分布二项分布是一种具有广泛用途的离散二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。里创立的,所以又叫贝努里分布。二项分布是心理与教育统计中常用的二项分布是心理与教育统计中常用的一种基本随机变量分布。一种基本随机变量分布。6.2.1 二项试验二项试验二项试验又称为贝努里试验,它必须满足二项试验又称为贝努里试验,它必须满足以下几个条件:以下几个条件:1.任何一次试验恰好有两个结果,成功与
18、失任何一次试验恰好有两个结果,成功与失败。败。2.共有共有n次试验,并且次试验,并且n是预先给定的任一正是预先给定的任一正数。数。3.每次试验各自独立,各次试验之间无相互每次试验各自独立,各次试验之间无相互影响。影响。4.某种结果出现的概率在任何一次试验中都某种结果出现的概率在任何一次试验中都是固定的。是固定的。是否为二项试验?是否为二项试验?(1)投掷硬币试验投掷硬币试验(2)一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只只红球,从袋中取球两次。红球,从袋中取球两次。(a)放回抽样,第一次取一只球,观察其)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。颜色
19、后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。中,第二次从剩余的球中再取一球。6.2.2 二项分布函数二项分布函数二项定理:二项定理:项数:二项展开式中共有项数:二项展开式中共有n1项。项。指数:指数:p的指数,从的指数,从n0下降;下降;q指数从指数从0n为上升。每项为上升。每项p与与q指数之和等于指数之和等于n。系数:系数:n个元素中依次取个元素中依次取0n个元素的组个元素的组合数。合数。11 11 2 11 3 3 11 4 6 4 11 5 1 0 10 5 11 6 15 20 15 6 1杨辉三角形杨
20、辉三角形 用用 n 次方的二项展开式来表达次方的二项展开式来表达在在 n 次二项试验中成功事件出现的次二项试验中成功事件出现的不同次数(不同次数(X0,1)的概率分)的概率分布,叫做二项分布函数。布,叫做二项分布函数。二项分布是一种离散型随机变量二项分布是一种离散型随机变量的概率分布。的概率分布。设有设有n次试验,各次试验彼此独立的,每次次试验,各次试验彼此独立的,每次试验某事件出现的概率都是试验某事件出现的概率都是p,某事件不出,某事件不出现的概率都是现的概率都是q(1-p),则对于某事件出),则对于某事件出现现X次(次(0,1,2,n)的概率分布为:)的概率分布为:式中:式中:(6.6)例
21、例 10个硬币投掷一次,或个硬币投掷一次,或1个硬币投掷个硬币投掷10次,问次,问5次正面向上的概率是多少?次正面向上的概率是多少?解:根据题意,解:根据题意,n=10,p=q=0.5,X=5例例 已知某长一批产品中一级品率为已知某长一批产品中一级品率为0.2现现在从中随机地抽查在从中随机地抽查20只。问只。问20只元件中恰只元件中恰好有好有6个一级品的概率是多少?个一级品的概率是多少?解:n=20,p=0.2,q=0.8.x=6某人进行射击练习,如果每次射击某人进行射击练习,如果每次射击击中的命中率为击中的命中率为0.02,独立射击,独立射击400次,试求至少击中两次的概率。次,试求至少击中
22、两次的概率。解:击中的次数为解:击中的次数为x,其对应概率为:,其对应概率为:一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红只红球,从袋中取球两次。球,从袋中取球两次。放回抽样,第一次取一只球,观察其颜色放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。后放回,搅匀后再取一球。求取到一只白球与一只红球的概率。求取到一只白球与一只红球的概率。解:实验次数解:实验次数n=2,取到白球的次数,取到白球的次数x=1,白,白球的概率球的概率p=4/6,红球的概率,红球的概率q=2/6.6.2.3 二项分布的性质二项分布的性质(一)(一)二项分布是离散型分布,概率直方图二
23、项分布是离散型分布,概率直方图是阶跃式。因为是阶跃式。因为X为不连续变量,用概率条图为不连续变量,用概率条图表示更为合适。表示更为合适。1个硬币投掷个硬币投掷5次,正面向上次,正面向上0,1,2,3,4,5次次的概率分别为:的概率分别为:5次10次20次40次80次160次当当p=q时,图形是对称的。时,图形是对称的。当当n趋近于无穷大时,二项分布趋近于趋近于无穷大时,二项分布趋近于正态分布。正态分布。p=q=0.5p=0.2,q=0.8l当当pq,二项分布为负偏态。二项分布为负偏态。l当当n很大,偏态逐渐降低,最终趋近于正态。很大,偏态逐渐降低,最终趋近于正态。l当当pq时,且时,且nq5.
24、这时二二项分布分布为正正态分布的近似形。分布的近似形。5次10次20次40次80次160次(二)二项分布的平均数和标准差(二)二项分布的平均数和标准差如果二项分布满足如果二项分布满足pq且且 nq5(或者(或者pq且且 np5时,二项分布接近于正态分时,二项分布接近于正态分布。可用下面的方法计算二项分布的平布。可用下面的方法计算二项分布的平均数和标准差。均数和标准差。二项分布的平均数为二项分布的平均数为二项分布的标准差为二项分布的标准差为(67)(68)求求p=0.2,q=0.8,n=160次的二项分布的平均值次的二项分布的平均值和标准差。和标准差。解:解:np=0.2160=325,该二二项
25、分布接近正分布接近正态分布。分布。6.2.4 二项分布的应用二项分布的应用二项分布函数除了用来求成功事件恰二项分布函数除了用来求成功事件恰好出现好出现X次的概率之外,在教育中主要次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性用来判断试验结果的机遇性与真实性的界限。的界限。例如,一个学生凭猜测做例如,一个学生凭猜测做10个是非题,平个是非题,平均可以猜对均可以猜对5题。什么情况下可以说他是题。什么情况下可以说他是真会而不是猜测呢?真会而不是猜测呢?做对题数做对题数概率概率累加概率累加概率0 00.0009770.0009770.0009770.0009771 10.0097660.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理与教育统计学第6章 概率分布 心理 教育 统计学 概率 分布
限制150内