频率分布、直方图与概率密度曲线.ppt
统计学中有两个核心问题统计学中有两个核心问题,一是如何从整一是如何从整体中抽取样本体中抽取样本?二是如何用样本估计总体二是如何用样本估计总体?本节课本节课,我们在初中学过样本的频率分我们在初中学过样本的频率分布的基础上布的基础上,研究总体的分布及其估计研究总体的分布及其估计.简单随机抽样、系统抽样和分层抽样简单随机抽样、系统抽样和分层抽样.经过前面的学习经过前面的学习,我们已经了解了一些常我们已经了解了一些常用的抽样方法用的抽样方法:1.1.同时掷两枚骰子同时掷两枚骰子,共掷共掷72007200次次,点数和的分布频数如下表所示点数和的分布频数如下表所示,计算各个结果的频率计算各个结果的频率,作出频率分布条形图作出频率分布条形图:点数和点数和23456789101112频频 数数2034075918059941218989813602381197频频 率率0.028 0.057 0.0820.1120.1380.1690.1370.1130.0840.0530.027掷两枚骰子的等可能性结果掷两枚骰子的等可能性结果234561234561第一枚骰子第一枚骰子第第二二枚枚骰骰子子2334445555766666777778888899991010101111 12离散型离散型:当总体中的个体所当总体中的个体所取的不同数值较少时取的不同数值较少时,其随其随机变量是离散型的机变量是离散型的.1.1.频率分布条形图频率分布条形图条形图要点:条形图要点:各直方长条的宽度要相同;各直方长条的宽度要相同;相邻长条之间的间隔要适当相邻长条之间的间隔要适当高度就是对应的频率值高度就是对应的频率值.1.1.同时掷两枚骰子同时掷两枚骰子,共掷共掷72007200次次,点数和的分布频数如下表所示点数和的分布频数如下表所示,计算各个结果的频率计算各个结果的频率,作出频率分布条形图:作出频率分布条形图:点数和点数和23456789101112频频 数数2034075918059941218989813602381197频频 率率0.028 0.057 0.0820.1120.1380.1690.1370.1130.0840.0530.02723456789101112点数和点数和频率频率136236336436536636频率分布的条形图频率分布的条形图每一个小矩形的高每一个小矩形的高就是对应的频率就是对应的频率离散型总体离散型总体25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.4225.47 25.35 25.41 25.43 25.44 25.48 25.45 25.4325.46 25.40 25.51 25.45 25.40 25.39 25.41 25.3625.38 25.31 25.56 25.43 25.40 25.38 25.37 25.4425.33 25.46 25.40 25.49 25.34 25.42 25.50 25.3725.35 25.32 25.45 25.40 25.27 25.43 25.54 25.3925.45 25.43 25.40 25.43 25.44 25.41 25.53 25.3725.38 25.24 25.44 25.40 25.36 25.42 25.39 25.4625.38 25.35 25.31 25.34 25.40 25.36 25.41 25.3225.38 25.42 25.40 25.33 25.37 25.41 25.49 25.3525.47 25.34 25.30 25.39 25.36 25.46 25.29 25.4025.37 25.33 25.40 25.35 25.41 25.37 25.47 25.3925.42 25.47 25.38 25.39 从规定尺寸为从规定尺寸为25.40 mm的一堆产品中任取的一堆产品中任取 100件件,测得它们的测得它们的实际尺寸如下实际尺寸如下:2.2.频率分布直方图频率分布直方图 如果把这堆产品中产品如果把这堆产品中产品尺寸的全体看作一个总体尺寸的全体看作一个总体,那么左边数据就是从总体那么左边数据就是从总体中抽取的一个容量为中抽取的一个容量为100的的样本样本 与前例子不同的是与前例子不同的是,这里这里的总体可以在一个实数区间的总体可以在一个实数区间内取值内取值(称为称为连续型总体连续型总体).运用在初中运用在初中“统计初步统计初步”里里学过的方法学过的方法,可以得到这些可以得到这些数据的数据的频率分布表频率分布表和和频率分频率分布直方图布直方图.计算极差计算极差R:R:最大值最大值25.56与最小值与最小值25.24的差为的差为0.32;决定组距与组数决定组距与组数:组距为组距为0.03与组数为与组数为11;决定分点决定分点:起点为起点为25.235,终点为终点为25.565.1.00100合计1.000.02225.535,25.565)0.980.02225.505,25.535)0.960.04425.475,25.505)0.920.1313正正正正25.445,25.475)0.790.1616正正正正正正25.415,25.445)0.630.2525正正正正正正正正正正25.385,25.415)0.380.1818正正正正正正25.355,25.385)0.200.1212正正正正25.325,25.355)0.080.055正正25.295,25.325)0.030.02225.265,25.295)0.010.01125.235,25.265)累计频率累计频率频率频率频数频数个数累计个数累计分组分组2.2.频率分布直方图频率分布直方图列频率分布表列频率分布表:频率分布直方图频率分布直方图:2.2.频率分布直方图频率分布直方图0.020.040.130.160.250.180.120.050.020.010.020.030.020.030.040.030.130.030.160.030.250.030.180.030.120.030.050.030.020.030.010.030.03每一个小矩形的每一个小矩形的面积恰好就是其面积恰好就是其对应的频率对应的频率,这些这些小矩形的面积和小矩形的面积和为为1.小矩形的高:小矩形的高:连续型连续型:当总体中的当总体中的个体所取的数值较多个体所取的数值较多,甚至无限时甚至无限时,其随机其随机变量是连续型的变量是连续型的.频率密频率密度度每一个小矩每一个小矩形的面积恰形的面积恰好就是其对好就是其对应的频率,应的频率,这些小矩形这些小矩形的面积和为的面积和为1.连续型总体连续型总体离散型总体离散型总体计算最大值与最小值的差计算最大值与最小值的差(知道这组数据的变动范围知道这组数据的变动范围)决定组距与组数决定组距与组数(将数据分组将数据分组)组数组数:将数据分组将数据分组,当数据在当数据在100个以内时个以内时,按数据多少常分按数据多少常分5-12组组.组距组距:指每个小组的两个端点的距离,指每个小组的两个端点的距离,决定分点决定分点列出频率分布表列出频率分布表.画出频率分布直方图。画出频率分布直方图。4.画频率分布直方图的步骤画频率分布直方图的步骤连续型总体连续型总体 所抽取的所抽取的100件产品中件产品中,尺寸落在各个小组内的频率的大小尺寸落在各个小组内的频率的大小.样本容量越大样本容量越大,所分组数越多所分组数越多,各组的频率就越接近于总体在相各组的频率就越接近于总体在相应各组取值的概率应各组取值的概率.设想样本容量无限增大设想样本容量无限增大,分组的组距无限缩分组的组距无限缩小小,那么频率分布直方图那么频率分布直方图折线折线就会无限接近于一条就会无限接近于一条光滑曲线光滑曲线总体密度曲线总体密度曲线.5.5.总体密度曲线总体密度曲线连续型总体连续型总体连接频率分布直方图中各连接频率分布直方图中各小长方形上端的中点小长方形上端的中点,得得到到频率分布折线图频率分布折线图.所抽取的所抽取的100件产品中件产品中,尺寸落在各个小组内的频率的大小尺寸落在各个小组内的频率的大小.样样本容量越大本容量越大,所分组数越多所分组数越多,各组的频率就越接近于总体在相应各组的频率就越接近于总体在相应各组取值的概率各组取值的概率.设想样本容量无限增大设想样本容量无限增大,分组的组距无限缩小分组的组距无限缩小,那么频率分布直方图那么频率分布直方图折线折线就会无限接近于一条就会无限接近于一条光滑曲线光滑曲线总总体密度曲线体密度曲线.5.5.总体密度曲线总体密度曲线连续型总体连续型总体连接频率分布直方图中各连接频率分布直方图中各小长方形上端的中点小长方形上端的中点,得得到到频率分布折线图频率分布折线图.样本容量无限增大样本容量无限增大,分组的组距无限缩小分组的组距无限缩小,那么频率分布直方图那么频率分布直方图就会无限接近于一条就会无限接近于一条光滑曲线光滑曲线总体密度曲线总体密度曲线.5.5.总体密度曲线总体密度曲线总体密度曲线总体密度曲线与与x轴围成的轴围成的面积为面积为1.连续型总体连续型总体频率分布折频率分布折线图线图无限接无限接近于一条近于一条光光滑曲线滑曲线.5.5.总体密度曲线总体密度曲线 总体密度总体密度曲线曲线反映了反映了总体分布总体分布,即反映了总体在各个范围内取值的概率即反映了总体在各个范围内取值的概率.根根据这条曲线据这条曲线,图中带斜线部分的图中带斜线部分的面积面积,就是总体就是总体在区间(在区间(a,b)内取值的概率)内取值的概率总体密度曲线总体密度曲线与与x轴围成的轴围成的面积为面积为1.连续型总体连续型总体总体密度曲线通常又叫总体密度曲线通常又叫概率密度曲线概率密度曲线,以概率密度曲线为图像的以概率密度曲线为图像的函数函数y=f(x)叫做叫做概率密度函数概率密度函数.如图如图,连续型随机变量落在连续型随机变量落在(a,b)内的内的概率概率为阴影部分为阴影部分面积面积.即即:例例1.1.已知随机变量已知随机变量的密度函数是的密度函数是画出画出的概率密度曲线的概率密度曲线;根据所根据所画画曲线曲线,求求在区间在区间(-0.5,0.5)(-0.5,0.5)内取值的概率内取值的概率.例例2.对某电子元件进行寿命追踪调查,情况如下:对某电子元件进行寿命追踪调查,情况如下:寿命寿命(h)100200 200300300400400500 500600个数个数2030804030(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图画出频率分布直方图(3)估计电子元件寿命在估计电子元件寿命在100h400h以内的概率;以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400h以上的概率;以上的概率;计算样本的期望计算样本的期望(总体均值总体均值).连续型总体连续型总体解:解:(1)样本频率分布表:样本频率分布表:寿命寿命(h)频数频数频率频率100200200.10200300300.15300400800.40400500400.20500600300.15合计合计2001(2)频率分布直方图频率分布直方图例例2.对某电子元件进行寿命追踪调查对某电子元件进行寿命追踪调查,情况如下情况如下:(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图画出频率分布直方图(3)估计电子元件寿命在估计电子元件寿命在100h400h以内的概率;以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400h以上的概率;以上的概率;计算样本期望计算样本期望.连续型总体连续型总体解:解:(1)样本频率分布表:样本频率分布表:寿命寿命(h)频数频数频率频率100200200.10200300300.15300400800.40400500400.20500600300.15合计合计2001(2)频率分布直方图频率分布直方图(3)由频率分布表可以看出由频率分布表可以看出,寿命在寿命在100h400h的电子元件出现的电子元件出现的频率为的频率为0.65,所以我们估计电子元件寿命在所以我们估计电子元件寿命在100h400h的概率的概率为为0.65例例2.对某电子元件进行寿命追踪调查,情况如下:对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图画出频率分布直方图(3)估计电子元件寿命在估计电子元件寿命在100h400h以内的概率;以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400h以上的概率;以上的概率;计算样本期望计算样本期望.解:解:(1)样本频率分布表:样本频率分布表:寿命寿命(h)频数频数频率频率100200200.10200300300.15300400800.40400500400.20500600300.15合计合计2001(2)频率分布直方图频率分布直方图例例2.对某电子元件进行寿命追踪调查,情况如下:对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图画出频率分布直方图(3)估计电子元件寿命在估计电子元件寿命在100h400h以内的概率;以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400h以上的概率;以上的概率;计算样本期望计算样本期望.(4)由频率分布表可知由频率分布表可知,寿命在寿命在400h以上的电子元件出现的以上的电子元件出现的频率为频率为0.20+0.150.35,故我们估计电子元件寿命在,故我们估计电子元件寿命在400h以上的概率为以上的概率为0.35.解:解:(1)样本频率分布表:样本频率分布表:寿命寿命(h)频数频数频率频率100200200.10200300300.15300400800.40400500400.20500600300.15合计合计2001(2)频率分布直方图频率分布直方图例例2.对某电子元件进行寿命追踪调查对某电子元件进行寿命追踪调查,情况如下情况如下:(1)列出频率分布表;列出频率分布表;(2)画出频率分布直方图画出频率分布直方图(3)估计电子元件寿命在估计电子元件寿命在100h400h以内的概率;以内的概率;(4)估计电子元件寿命在估计电子元件寿命在400h以上的概率;以上的概率;计算样本的期望计算样本的期望(总体均值总体均值).样本的期望为样本的期望为(总体均值总体均值):2.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的)的百分比是多少百分比是多少?解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.518.50.0600.07024.530.5 33.52.总体密度曲线总体密度曲线.一般样本容量越大一般样本容量越大,频率分布直方图频率分布直方图就会无限接近就会无限接近总体密度曲线总体密度曲线,就越精确地反映了总体的分布规律就越精确地反映了总体的分布规律,即越精确地反映了总体在各即越精确地反映了总体在各个范围内取值百分比个范围内取值百分比.课堂小结课堂小结1.频率分布的表现形式有频率分布的表现形式有:本讲到此结束,请同学们课后再做好复习.谢谢!作业作业课堂作业课堂作业:课本课本:P243,:P243,练习练习A与与B预习预习:正态分布正态分布P243-244P243-244