【高中数学】正态分布 课件 2022-2023学年高二下学期数学人教A版(2019)选择性必修第三册.pptx
第七章 随机变量及其分布人教A 版2019 必修第三册7.5 正态分布教学目标1.通过误差模型,了解服从正态分布的随机变量;2.通过具体实例,借助频率分布直方图的几何直观,了解正态分布的特点;3.了解正态分布的均值、方差及其含义;(重点)4.了解3原则,会求随机变量在特殊区间内的概率.随机变量:一般地,对于随机试验样本空间 中的每个样本点,都有唯一的实数X()与之对应,我们称X 为随机变量.离散型随机变量:可能取值为有限个或可以一一列举的随机变量,我们称为离散型随机变量.从10 张已编好号码的卡片(从1 号到10 号)中任取1 张,被抽出卡片的编号;抛掷两枚质地均匀的骰子,出现的点数之和;2.同一年级学生的考试成绩零件的尺寸3.流水线上产品的质量误差纤维的纤度电容器的电容量电子管的使用命等4.某地每年七月份平均气温平均湿度在现实生活中体重1、某一地区同年龄人身高肺活量 这些问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为0,我们称这类随机变量为_连续型随机变量问题 自动流水线包装的食盐,每袋标准质量为400g.由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准质量).用X表示这种误差,则X是一个连续型随机变量.检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位:g)的观测值如下:-0.6-1.4-0.7 3.3-2.9-5.2 1.4 0.1 4.4 0.9-2.6-3.4-0.7-3.2-1.7 2.9 0.6 1.7 2.9 1.2 0.5-3.7 2.7 1.1-3.0-2.6-1.9 1.7 2.6 0.4 2.6-2.0-0.2 1.8-0.7-1.3-0.5-1.3 0.2-2.1 2.4-1.5-0.4 3.8-0.1 1.5 0.3-1.8 0.0 2.5 3.5-4.2-1.0-0.2 0.1 0.9 1.1 2.2 0.9-0.6-4.4-1.1 3.9-1.0-0.6 1.7 0.3-2.4-0.1-1.7-0.5-0.8 1.7 1.4 4.4 1.2-1.8-3.1-2.1-1.6 2.2 0.3 4.8-0.8-3.5-2.7 3.8 1.4-3.5-0.9-2.2-0.7-1.3 1.5-1.5-2.2 1.0 1.3 1.7-0.9情境引入思考1:(1)如何描述这100个样本误差数据的分布?(2)如何构建适当的概率模型刻画误差X的分布?根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布,如图(1)所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.观察图形可知:误差观测值有正有负,并大致对称地分布在X=0 的两侧,而且小误差比大误差出现得更频繁.频率/组距X-60-4-200.150.050.100.204 26 随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图(2)所示.根据频率与概率的关系,可用图(3)中的钟形曲线(曲线与水平轴之间的区域的面积为1)来描述袋装食盐质量误差的概率分布.例如,任意抽取一袋食盐,误差落在-2,-1 内的概率,可用图中黄色阴影部分的面积表示.0-6-4 2 0-2频率/组距0.050.100.150.20X4 6(2)0-6-4 2 0-2f(x)0.050.100.150.20X4 6(3)思考2 由函数知识可知,图(3)中的钟形曲线是一个函数.那么,这个函数是否存在解析式呢?0-6-4 2 0-2f(x)0.050.100.150.20X4 6(3)答案是肯定的.在数学家的不懈努力下,找到了以下刻画随机误差分布的解析式:其中 R,0 为参数.显然,对任意的xR,f(x)0,它的图象在x轴的上方,可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,若随机变量X 的概率分布密度函数为f(x),则称随机变量X 服从正态分布,记为XN(,2).特别地,当=0,=1 时,称随机变量X服从标准正态分布.探究新知若XN(,2),则如图(4)所示,X 取值不超过x的概率P(Xx)为图中区域A 的面积,而P(aXb)为区域B 的面积.(4)探究新知 高斯是一个伟大的数学家,一生中的重要贡献不胜枚举德国的10马克纸币上印有高斯的头像和正态分布的曲线,这就传达了一个信息:在高斯的科学贡献中,对人类文明影响最大的是正态分布由X 的密度函数及图象可以发现,正态曲线还有以下特点:思考3 观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?(1)曲线是单峰的,它关于直线x=对称;(3)当|x|无限增大时,曲线无限接近x轴.(2)曲线在x=处达到峰值 探究新知正态密度曲线 思考4 一个正态分布由参数和完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?由于正态曲线关于x=对称,因此,当参数固定时,正态曲线的位置由 确定,且随着 的变化而沿x轴平移,所以参数 反映了正态分布的集中位置,可以用均值来估计,故有探究新知正态密度曲线 思考4 一个正态分布由参数和完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?当 固定时,因为正态曲线的峰值与 成反比,而且对任意的0,正态曲线与x轴之间的区域的面积总为1.因此,当 较小时,峰值高,曲线“瘦高”,表示随机变量X 的分布比较集中;当 较大时,峰值低,曲线“矮胖”,表示随机变量X 的分布比较分散,所以 反映了随机变量的分布相对于均值 的离散程度,可以用标准差来估计,故有探究新知正态密度曲线(1)曲线在x轴的上方,与x轴不相交;(3)曲线与x轴之间的面积为1;(4)当一定时,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.正态曲线的性质:(5)参数反映了正态分布的集中位置,反映了随机变量的分布相对于均值的离散程度.在实际问题中,参数,可以分别用样本均值和样本标准差来估计,故有(2)曲线是单峰的,它关于直线x=对称,且在x=处取得最大值 归纳总结1.若XN(2,32),则E(X)=_,D(X)=_.2 932 2.XN(,2),若E(X)=3,(X)=2,则=_,=_.归纳总结正态曲线下的面积规律:-x1-x2 x2 x1a-a正态曲线下对称区域的面积相等对应的概率也相等利用“对称法”求正态分布下随机变量在某个区间的概率01 2-1-2xy-33 4=10.51-aa1-a1-2a3.若XN(1,2),且P(X1)=_;(2)P(X0)=_;(3)P(X2)=_;(4)P(X2)=_;(6)P(0X2)=_;(5)P(0X1)=_.0.5-a 假设XN(,2),可以证明:对给定的kN*,P(-k X+k)是一个只与k有关的定值.特殊区间的概率:由此看到,尽管正态变量的取值范围是(-,+),但在一次试验中,X 的取值几乎总是落在区间-3,+3 内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.在实际应用中,通常认为服从于正态分布N(,2)的随机变量X 只取-3,+3 中的值,这在统计学中称为3 原则.探究新知1.已 知 随 机 变 量 服 从 正 态 分 布,其 正 态 曲 线 如 图 所 示,则 总 体 的 均值,方差2.20 2 2.设随机变量XN(0,1),则X的密度函数为_,P(X0)=_,P(|X|1)=_,P(X1)=_,P(X1)=_.0.50.68270.841350.15865O 1-1 xy=0小试牛刀 3.设随机变量XN(0,22),随机变量YN(0,32),画出分布密度曲线草图,并指出P(X-2)与P(X2)的关系,以及P(|X|1)与P(|Y|1)之间的大小关系.O1-1 xy=3=22-2解:作出分布密度曲线如图示,由图可知小试牛刀A服从正态分布的变量在某个区间内取值概率的求解策略(4)求解时,可画出概率分布密度函数的图像,结合图像解答.素养小结例1:李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30 min,样本方差为36;骑自行车平均用时34 min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布.(1)估计X,Y的分布中的参数;(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;(3)如果某天有38 min可用,李明应选择哪种交通工具?如果某天只有34 min可用,又应该选择哪种交通工具?请说明理由.解:(1)随机变量X 的样本均值为30,样本标准差为6;随机变量Y 的样本均值为34,样本标准差为2.用样本均值估计参数,用样本标准差估计参数,可以得到XN(30,62),YN(34,22).(2)由(1)得XN(30,62),YN(34,22),作出X 和Y 的分布密度曲线如图示.(3)应选择在给定时间内不迟到的概率大的交通工具.由图可知,P(X38)P(Y34).所以,如果有38 min 可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34 min 可用,那么坐公交车不迟到的概率大,应选择坐公交车.(2)检测员根据抽检结果,判断出该生产线出现异常,要求立即停产检测.检测员的判断是否合理?请说明理由.若随机变量X 的概率分布密度函数为f(x),则称随机变量X 服从正态分布,记为XN(,2).特别地,当=0,=1 时,称随机变量X 服从标准正态分布.1.正态分布:正态密度函数:2.特殊区间的概率:课堂小结(1)利用正态密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x对称,曲线与x轴之间的区域的面积为1.(2)利用3原则求概率问题时,要注意把给出的区间或范围与,进行对比联系,确定它们属于,,2,2,3,3中的哪一个.正态分布下两类常见的概率计算在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;而在理性的世界里,所有的判断都是统计学。-C.R.Rao 统计与真理正态魅影 解:正 态 变 量 几 乎 总 是 落 在 区 间 3,3 内,所 以 可 通 过 判 断取出的产品的外直径是否落在这一区间内来分析生产状况是否正常.N(10,0.22),3 10.6,3 9.4,9.529.4,10.6,9.989.4,10.6,该厂这一天的生产状况是正常的.1.某厂生产的“T”形零件的外直径(单位:cm)XN(10,0.22),某天从该厂生产的“T”形零件中随机取出两个,测得它们的外直径分别为9.52cm和9.98cm,试分析该厂这一天的生产状况是否正常.说 明:解 题 时,应 当 注 意 零 件 尺 寸 应 落 在 3,3 之 内,否 则可 以 认 为 该 批 产 品 不 合 格.判 断 的 根 据 是 概 率 较 小 的 事 件 在 一 次试 验 中 几 乎 是 不 可 能 发 生 的,而 一 旦 发 生 了,就 可 以 认 为 这 批 产 生不合格.2.假设某地区高二学生的身高服从正态分布,且均值为170(单位:cm,下同),标准差为10.在该地区任意抽取一名高二学生,求这名学生的身高:(1)不高于170的概率;(2)在区间160,180内的概率;(3)不高于180的概率.3.设在一次数学考试中,某班学生的分数XN(110,202),且知试卷满分150分,这个班的学生共54人,求这个班在这次数学考试中及格(即90分及90分以上)的人数和130分以上的人数.解:=110,=20,P(X 90)=P(X-110-20)=P(X-),P(X-)2 P(X-)+0.683=1,P(X-)=0.158 5.P(X 90)=1-P(X-130)=P(X-110 20)=P(X-),P(X-)0.683+2P(X-)=1,P(X-)=0.158 5,即P(X130)=0.158 5.540.158 59(人),即130分以上的人数约为9人.