内蒙古准格尔旗高中数学第二章统计2.2用样本的频率分布估计总体分布课件1新人教B版必修3.ppt
2.2.1 用样本的频率分布估计用样本的频率分布估计 总体分布总体分布用样本估计总体用样本估计总体 在统计中,用样本的有关情况估计总体在统计中,用样本的有关情况估计总体的相应情况大体上有两类方法:的相应情况大体上有两类方法:一、用样本的一、用样本的频率分布频率分布去估计总体分布去估计总体分布二、用样本的某种二、用样本的某种数字特征数字特征去估计总体相应去估计总体相应数字特征数字特征 (如平均数、标准差等)(如平均数、标准差等)抽抽查查某某地地区区55名名12岁岁男男生生的的身身高高(单单位位:cm)的的测量值如下:测量值如下:128.1 144.4 150.3 146.2 140.6 126.0 125.6 127.7 154.4 142.7 141.2 142.7 137.6 136.9 132.3 131.8 147.7 138.4 136.6 136.2 141.6 141.1 133.1 142.8 136.8 133.1 144.5 142.4 140.8 127.7 150.7 160.3 138.8 154.3 147.9 141.3 143.8 138.1 139.7 142.9 144.7 148.5 138.3 135.3 134.5 140.6 138.4 137.3 149.5 142.5 139.3 156.1 152.2 129.8 133.2 试从以上数据中,对该地区试从以上数据中,对该地区12岁男生的身高情况进岁男生的身高情况进行大致的推测行大致的推测.情景导入情景导入 为为此此,需需要要对对统统计计数数据据进进行行整整理理和和分分析析.分分析析数数据据的的一一种种基基本本方方法法是是用用图图将将他他们们画画出出来来,或或用用表表格格改改变变数据的排列方式数据的排列方式.128.1 144.4 150.3 146.2 140.6 126.0 125.6 127.7 154.4 142.7 141.2 142.7 137.6 136.9 132.3 131.8 147.7 138.4 136.6 136.2 141.6 141.1 133.1 142.8 136.8 133.1 144.5 142.4 140.8 127.7 150.7 160.3 138.8 154.3 147.9 141.3 143.8 138.1 139.7 142.9 144.7 148.5 138.3 135.3 134.5 140.6 138.4 137.3 149.5 142.5 139.3 156.1 152.2 129.8 133.2根据以上数据可以画出频数分布表和频数分布图,从根据以上数据可以画出频数分布表和频数分布图,从图表中可以清楚地知道图表中可以清楚地知道数据分布在各个小组的个数数据分布在各个小组的个数.频率分布表和频率分布图,则从频率分布表和频率分布图,则从各个小组的数据各个小组的数据在在样样本容量本容量中所占中所占比例比例的大小来表示数据分布的规律的大小来表示数据分布的规律.画频率分布直方图的具体做法如下:画频率分布直方图的具体做法如下:1 1、求极差(最大值与最小值的差)、求极差(最大值与最小值的差)160.3-125.6=34.72 2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)组数极差组数极差/组距组距34.7/56.9因此组距为因此组距为5 5,组数为,组数为7 73 3、将数据分组、将数据分组4 4、画频率分布表、画频率分布表125.45 ,130.45),130.45,135.45),135.45,140.45),140.45,145.45),145.45,150.45),150.45,155.45),155.45,160.45分分 组组频数频数频率频率125.45 ,130.45)60.109130.45,135.45)70.127135.45,140.45)140.255140.45,145.45)170.309145.45,150.45)50.091150.45,155.45)40.073155.45,160.4520.036合计551.005555名名1212岁男生身高的频率分布表岁男生身高的频率分布表一、频率分布表一、频率分布表4 4、画频率分布表、画频率分布表5 5、画频率分布直方图、画频率分布直方图125.45 130.45160.45身高身高/cm频率频率组距组距0.010.02二、频率分布直方图二、频率分布直方图1 1、频率分布表列出的是数据落在各个小、频率分布表列出的是数据落在各个小组的组的频率频率.2 2、频率分布直方图是用、频率分布直方图是用面积面积表示数据落表示数据落在各个小组的频率的大小在各个小组的频率的大小.在频率分布直在频率分布直方图中,各小长方形面积之和为方图中,各小长方形面积之和为1 1.说明:说明:画频率分布直方图的一般步骤:画频率分布直方图的一般步骤:1、求极差(最大值与最小值的差)、求极差(最大值与最小值的差)2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)组数极差组数极差/组距组距当样本容量不超过当样本容量不超过100时,组数一般为时,组数一般为512组组5、画频率分布直方图、画频率分布直方图4、画频率分布表、画频率分布表二、频率分布直方图二、频率分布直方图3、将数据分组、将数据分组125.45 130.45160.45身高身高频率频率组距组距0.010.02三、频率分布折线图三、频率分布折线图随着样本容量的增加,作图时所分的组随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中会越来越接近于一条光滑曲线,统计中称这条光滑曲线为称这条光滑曲线为总体密度曲线总体密度曲线.四、总体密度曲线四、总体密度曲线四、总体密度曲线四、总体密度曲线频率频率组距组距身高身高ab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在区间区间(a,b)内取值的百分比)内取值的百分比).反映了总体分布,即反映了总体在各个范围内反映了总体分布,即反映了总体在各个范围内取值的百分比取值的百分比说明:说明:总体密度曲线是总体密度曲线是客观存在客观存在的,但在实际中,的,但在实际中,我们只能用样本来估计我们只能用样本来估计.由于样本是随机的,不同由于样本是随机的,不同的样本得到的频率分布折线图不同;即使是同一样的样本得到的频率分布折线图不同;即使是同一样本,不同的分组得到的频率分布折线图也不同本,不同的分组得到的频率分布折线图也不同.也就是说:也就是说:频率分布折线图是随着样本的容量和分频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线布折线图得到准确的总体密度曲线.例例1、为了了解某地高一年级男生的身高情况,、为了了解某地高一年级男生的身高情况,从其中的一个学校选取容量为从其中的一个学校选取容量为60的样本(的样本(60名名男生的身高,单位:男生的身高,单位:cm),分组情况如下:),分组情况如下:分组分组151.5158.5158.5165.5165.5172.5172.5179.5频数频数621m频率频率a0.1则表中的则表中的m=,a=6 60.450.452727例例2、一个社会调查机构就某地居民的月收入调查了、一个社会调查机构就某地居民的月收入调查了10000人人,并根据所得数据画了样本的频率分布直方图并根据所得数据画了样本的频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联为了分析居民的收入与年龄、学历、职业等方面的联系,要从这系,要从这10000人中再用分层抽样的方法抽出人中再用分层抽样的方法抽出100人人作进一步调查,则在作进一步调查,则在2500,3000(元元)月收入段应抽出月收入段应抽出 _人人.0.00010.00020.00030.00040.00051000200015002500300035004000月收入月收入(元元)频率频率/组距组距2525试验试验1 1、进行、进行“抛掷硬币抛掷硬币”试验的试验结果试验的试验结果画出频率分布的条形图画出频率分布的条形图 注意点:注意点:各直方长条的宽度要相同;各直方长条的宽度要相同;相邻长条之间的间隔要适当相邻长条之间的间隔要适当结论:当试验次数无限增大时结论:当试验次数无限增大时,试验结果试验结果频数频数频率频率正面向上正面向上361240.5011反面向上反面向上359640.4989频率频率试验结果试验结果0 01 1正面向上正面向上 反面向上反面向上0.0.5 5概率概率0.50.50.50.5两种试验结果的频率大致相同两种试验结果的频率大致相同.五、总体分布五、总体分布 排排除除了了抽抽样样造造成成的的误误差差,精精确确地地反反映映了了总总体体取取值值的的概概率率分分布布规规律律.这这种种总总体体取取值值的的概概率率分分布规律通常成为布规律通常成为总体分布总体分布.(2)(2)研研究究总总体体概概率率分分布布往往往往可可以以研研究究其其频频数数分分布、频率分布布、频率分布.频率分布与总体分布的关系频率分布与总体分布的关系:(1)(1)通过样本的频数分布、频率分布可以估计通过样本的频数分布、频率分布可以估计总体的概率分布总体的概率分布.抽样过程中加大样本容量,抽样过程中加大样本容量,排除抽样造成排除抽样造成的误差,这样样本的分布频率精确地反映了总体的误差,这样样本的分布频率精确地反映了总体取值的概率分布规律取值的概率分布规律.用样本的频率分布估计总体分布,可以分为两种情况用样本的频率分布估计总体分布,可以分为两种情况.(1)当总体中的个体取)当总体中的个体取不同数值很少不同数值很少时,如试验时,如试验1,其几何表示用条形图;其几何表示用条形图;(2)当总体中的个体取当总体中的个体取不同数值较多、甚至无限时不同数值较多、甚至无限时或总体可以在一个实数区间内取值或总体可以在一个实数区间内取值,如试验,如试验2,其几,其几何表示用直方图何表示用直方图.说明:以上两种情况的不同之处在于:前者的频率说明:以上两种情况的不同之处在于:前者的频率分布表列出的是几个不同数值的频率,条形图用其分布表列出的是几个不同数值的频率,条形图用其高度高度来表示取各个值的频率;后者的频率分布表列来表示取各个值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率,直方图用其出的是在各个不同区间内取值的频率,直方图用其图形面积的大小图形面积的大小来表示在各个区间内取值的频率,来表示在各个区间内取值的频率,各长方形面积之和为各长方形面积之和为1.NBA某赛季甲、乙两名篮球运动员每场比赛的得分某赛季甲、乙两名篮球运动员每场比赛的得分的原始纪录如下:的原始纪录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.问题一:请用适当的方法表示上述数据,并对两名问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较运动员的得分能力进行比较.六、茎叶图六、茎叶图频率分布表频率分布表分组分组频数频数频率频率甲甲乙乙甲甲(11)乙乙(13)0,10)100.09 0.00 10,20)320.27 0.15 20,30)320.27 0.15 30,40)360.27 0.46 40,50)020.00 0.15 50,60)110.09 0.08 问题:用上次课所学的制作样本的频率分布直方图问题:用上次课所学的制作样本的频率分布直方图来分析好吗?来分析好吗?甲:甲:13,51,23,8,26,38,16,33,14,28,39;乙:乙:49,24,12,31,50,31,44,36,15,37,25,36,39.当数据比较少时,应用列分布直方图反当数据比较少时,应用列分布直方图反而不方便而不方便 茎叶图:顾名思义,茎是指中间的一列数,叶茎叶图:顾名思义,茎是指中间的一列数,叶就是从茎的旁边生长出来的数就是从茎的旁边生长出来的数.中间的数字表示中间的数字表示得分的十位数,旁边的数字分别表示两个人得分得分的十位数,旁边的数字分别表示两个人得分的个位数的个位数.茎叶图特点:茎叶图特点:茎叶图不仅能保留原始数据,而且能够展示数据茎叶图不仅能保留原始数据,而且能够展示数据的分布情况的分布情况.乙:得分基本上是对称的,叶的分布是乙:得分基本上是对称的,叶的分布是“单峰单峰”的,的,有有10/13的叶是分布在茎的叶是分布在茎2、3、4上,中位数是上,中位数是36.甲:得分除一个特殊得分(甲:得分除一个特殊得分(51分)外,也大致对称,分)外,也大致对称,分布也是分布也是“单峰单峰”的,有的,有9/11的叶主要集中在茎的叶主要集中在茎1、2、3上,中位数是上,中位数是26.从上述中位数的大小就可以看得出,乙运动员的从上述中位数的大小就可以看得出,乙运动员的成绩更好成绩更好.另外,乙运动员的得分更集中于峰值另外,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定附近,这说明乙运动员的发挥更稳定.