学案__用样本的频率分布估计总体的分布.ppt
1. 1.频数、频率频数、频率 将一批数据按要求分为若干个组,各组内数据的将一批数据按要求分为若干个组,各组内数据的 ,叫做该组的,叫做该组的 ,每组频数除以,每组频数除以 的的个数即得该组的个数即得该组的 . . 2. 2.频率分布表频率分布表 当总体很大或不便于获得时当总体很大或不便于获得时, ,可以用可以用 . .估计总体的频率分布估计总体的频率分布, ,反映总体频率分布的表格称为频率分反映总体频率分布的表格称为频率分布表布表. . 3. 3.频率分布直方图频率分布直方图 以横轴表示以横轴表示 , ,纵轴表示纵轴表示 , ,以每个组距为底以每个组距为底, ,以各频率除以组距的商为高以各频率除以组距的商为高, ,分别画成矩形分别画成矩形, ,这样就得到了这样就得到了频率分布直方图频率分布直方图. .个数个数 频数频数 频率频率 样本容量样本容量 样本的频率分布样本的频率分布 总分总分 组距组距频率频率 4. 4.频率分布折线图频率分布折线图 把频率分布直方图各个长方形上底边的把频率分布直方图各个长方形上底边的 用线段用线段连接起来连接起来, ,就得到频率分布折线图就得到频率分布折线图. . 5. 5.总体密度曲线总体密度曲线 频率分布直方图的优点是它反映了数据的变化趋势频率分布直方图的优点是它反映了数据的变化趋势, ,如如果样本容量不断增大果样本容量不断增大, ,分组的组距不断缩小分组的组距不断缩小, ,则频率分布直则频率分布直方图实际上越来越接近于总体的分布,它可以用一条方图实际上越来越接近于总体的分布,它可以用一条 来描绘来描绘, ,这条光滑曲线就叫做总体密度曲线这条光滑曲线就叫做总体密度曲线. .中点中点 光滑曲线光滑曲线一个容量为一个容量为4040的样本数据,分组后,组距与频数如下:的样本数据,分组后,组距与频数如下:5,105,10)5 5个;个;10,1510,15)1212个;个;15,2015,20)7 7个;个;20,2520,25)5 5个;个;25,3025,30)7 7个;个;30,3530,354 4个个. .则样本在区间则样本在区间20,+20,+)上的)上的频率为频率为_._.【解析【解析】在区间在区间20,+20,+)上的频数为)上的频数为5+7+4=165+7+4=16,故所求频率,故所求频率为为 答案:答案:0.40.4160.4.40频率分布直方图的应用频率分布直方图的应用 为了了解高一学生的体能情况为了了解高一学生的体能情况, ,某校抽取部分学生进行一某校抽取部分学生进行一分钟跳绳次数测试分钟跳绳次数测试, ,将所得数据整理后将所得数据整理后, ,画出频率分布直方画出频率分布直方图图( (如图如图2-4-22-4-2所示所示),),图中从左到右各小长方形面积之比为图中从左到右各小长方形面积之比为24171593,24171593,第二小组频数为第二小组频数为12.12.图图2-4-22-4-2 【分分析】析】考查频率分布直方图的应用考查频率分布直方图的应用. .(1)(1)第二小组的频率是多少第二小组的频率是多少? ?样本容量是多少样本容量是多少? ?(2)(2)若次数在若次数在110110以上以上( (含含110110次次) )为达标为达标, ,试估计该校全体高试估计该校全体高 一学生的达标率是多少一学生的达标率是多少? ?【解析【解析】(1)(1)由于频率分布直方图以面积的形式反映了由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小数据落在各个小组内的频率大小, ,因此第二小组的频率为因此第二小组的频率为又因为频率又因为频率= = , ,所以样本容量所以样本容量= =150.=150.08. 0391517424样本容量样本容量第二小组频数第二小组频数08. 012第二小组频率第二小组频率第二小组频数第二小组频数(2)(2)由图可估计该校高一学生的达标率约为由图可估计该校高一学生的达标率约为故第二小组的频率是故第二小组的频率是0.08,0.08,样本容量是样本容量是150150,高一学,高一学生达标率是生达标率是88%.88%.%.88%10039151742391517 【评评析】(析】(1 1)频率分布直方图能够很容易地表示大)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到题量数据,非常直观地表明分布的形状,使我们能够看到题意中看不清楚的信息和数据模式意中看不清楚的信息和数据模式. . (2)(2)频率分布直方图反映了样本在各个范围内取值的频率分布直方图反映了样本在各个范围内取值的可能性可能性, ,由抽样的代表性由抽样的代表性, ,利用样本在某一范围内的频率利用样本在某一范围内的频率, ,可近似地估计总体在这一范围内的可能性可近似地估计总体在这一范围内的可能性. .在学校开展的综合实践活动中在学校开展的综合实践活动中, ,某班进行了小制作评比某班进行了小制作评比, ,作作品上交时间为品上交时间为5 5月月1 1日至日至3030日日, ,评委会把同学们上交作品的件评委会把同学们上交作品的件数按数按5 5天一组分组统计天一组分组统计, ,绘制了频率分布直方图绘制了频率分布直方图( (如图如图2-4-32-4-3所示所示).).已知从左到右各长方形的高的比为已知从左到右各长方形的高的比为2346234641,41,第三组的频数为第三组的频数为12,12,请解答下列问题请解答下列问题: :图图2-4-32-4-3(1)(1)本次活动共有多少件作品参加评比本次活动共有多少件作品参加评比? ?(2)(2)哪组上交的作品数最多哪组上交的作品数最多? ?有多少件有多少件? ?(3)(3)经过评比经过评比, ,第四组和第六组分别有第四组和第六组分别有1010件、件、2 2件作品获奖件作品获奖, , 问这两组哪组获奖率较高问这两组哪组获奖率较高? ?解解:(1):(1)依题意知第三组的频率为依题意知第三组的频率为又因为第三组的频数为又因为第三组的频数为12,12,所以本次活动的参评作品数为所以本次活动的参评作品数为 =60(=60(件件).).5114643245112(2)(2)根据频率分布直方图根据频率分布直方图, ,可以看出第四组上交的作品数量最可以看出第四组上交的作品数量最多多, ,共有共有6060 =18(=18(件件).).(3)(3)第四组的获奖率是第四组的获奖率是 , ,第六组上交的作品数量为第六组上交的作品数量为6060 =3( =3(件件).).第六组的获奖率为第六组的获奖率为 , ,显然第六组的获奖率较高显然第六组的获奖率较高. .146432695181014643219632某市对上、下班交通情况进行抽样调查,上、下班时间各某市对上、下班交通情况进行抽样调查,上、下班时间各抽取了抽取了1212辆机动车行驶时速如下:(单位:辆机动车行驶时速如下:(单位:km/hkm/h)上班时间:上班时间:3030 3333 1818 2727 3232 4040 2626 2828 2121 2828 3535 2020下班时间:下班时间:2727 1919 3232 2929 3636 2929 3030 2222 2525 1616 1717 3030用茎叶图表示上面的样本数据,并求出样本数据的中位数用茎叶图表示上面的样本数据,并求出样本数据的中位数. .解:根据题意绘出该市上、下班交通情况的茎叶图,如图解:根据题意绘出该市上、下班交通情况的茎叶图,如图所示所示. . 由图可见,上班时间行驶时速的中位数是由图可见,上班时间行驶时速的中位数是2828,下班时间行,下班时间行驶时速的中位数是驶时速的中位数是28.28.【变式训练【变式训练】如图是如图是20122012年青年歌手大奖赛中七位评委为甲、年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图乙两名选手打出的分数的茎叶图(图中(图中m m为数字为数字0 09 9中的一个),中的一个),去掉一个最高分和一个最低分后,去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分甲、乙两名选手得分的平均数分别为别为a a1 1,a a2 2,则一定有(,则一定有( )(A A)a a1 1aa2 2 (B B)a a2 2aa1 1(C C)a a1 1=a=a2 2 (D D)a a1 1,a,a2 2的大小与的大小与m m的值有关的值有关【解析【解析】选选B.B.根据茎叶图可知,去掉一个最高分和一个最低分根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为后,甲的平均分为 乙的平均分为乙的平均分为故故a a2 2aa1 1. .15455 1a80845 ,244647a80855 ,【易错误区【易错误区】求解频率分布直方图问题时的常见错误求解频率分布直方图问题时的常见错误【典例】(【典例】(20112011湖北高考)有一个容量为湖北高考)有一个容量为200200的样本,其频的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间本数据落在区间1010,1212)内的频数为()内的频数为( )(A A)18 18 (B B)36 36 (C C)54 54 (D D)7272 【解题指导【解题指导】 【解析【解析】选选B.B.设样本数据落在区间设样本数据落在区间1010,1212)内的频率为)内的频率为2x2x,则则(0.02+0.05+x+0.15+0.190.02+0.05+x+0.15+0.19)2=12=1, ,得得x=0.09x=0.09,所以样本数,所以样本数据落在区间据落在区间10,1210,12)内的频数为)内的频数为0.090.092 2200=36.200=36. 1.1.如何理解用样本的频率分布估计总体的分布如何理解用样本的频率分布估计总体的分布? ? 总体分布是指总体取值的分布规律总体分布是指总体取值的分布规律, ,这种分布我们一般这种分布我们一般是不知道的是不知道的. .用样本去估计总体用样本去估计总体, ,是研究统计问题的一个基是研究统计问题的一个基本思想本思想, ,对于不易知道的总体分布对于不易知道的总体分布, ,常常用样本的频率分布常常用样本的频率分布对它进行估计对它进行估计. .样本的容量越大样本的容量越大, ,这种估计就越精确这种估计就越精确. .用样本用样本估计的思想就是用部分考察全体、用离散考察连续、用有估计的思想就是用部分考察全体、用离散考察连续、用有限考察无限的思想限考察无限的思想, ,是用观察测量值来探究客观规律的一种是用观察测量值来探究客观规律的一种重要的基本思想重要的基本思想. . 用样本的频率分布估计总体的分布时用样本的频率分布估计总体的分布时, ,要使样本能够很要使样本能够很好的反映总体的特征好的反映总体的特征, ,必须随机抽取样本必须随机抽取样本. .由于抽样的随机由于抽样的随机性性, ,当抽取的样本变化时当抽取的样本变化时, ,所形成的样本频率分布一般会与所形成的样本频率分布一般会与前一个样本频率分布有所不同前一个样本频率分布有所不同. .但是但是, ,它们都可以近似地看它们都可以近似地看作总体的分布作总体的分布. . 2.2.如何理解频率分布折线图与总体密度曲线如何理解频率分布折线图与总体密度曲线? ? (1)(1)为了方便看图为了方便看图, ,一般习惯于把频率分布折线图画成一般习惯于把频率分布折线图画成与横轴相连与横轴相连, ,所以横轴上的左右两端点没有实际的意义所以横轴上的左右两端点没有实际的意义. . (2)(2)总体密度曲线呈中间高、两边低的总体密度曲线呈中间高、两边低的“钟钟”形分布形分布, ,总体的数据大致呈对称分布总体的数据大致呈对称分布, ,并且大部分数据都集中在靠近并且大部分数据都集中在靠近中间的区间内中间的区间内. . 用样本的频率分布估计总体的分布时用样本的频率分布估计总体的分布时, ,要使样本能够很要使样本能够很好的反映总体的特征好的反映总体的特征, ,必须随机抽取样本必须随机抽取样本. .由于抽样的随机由于抽样的随机性性, ,当抽取的样本变化时当抽取的样本变化时, ,所形成的样本频率分布一般会与所形成的样本频率分布一般会与前一个样本频率分布有所不同前一个样本频率分布有所不同. .但是但是, ,它们都可以近似地看它们都可以近似地看作总体的分布作总体的分布. . 3.3.茎叶图有哪些优点茎叶图有哪些优点? ? 用茎叶图表示有两个突出的优点用茎叶图表示有两个突出的优点: :其一其一, ,在统计图上没在统计图上没有原始信息的损失有原始信息的损失, ,所有的信息都可以从这个茎叶图中得到所有的信息都可以从这个茎叶图中得到; ;其二其二, ,茎叶图可以在比赛时随时记录茎叶图可以在比赛时随时记录, ,方便记录与表示方便记录与表示. .但茎但茎叶图便于表示两位有效数字的数据叶图便于表示两位有效数字的数据, ,虽然可以表示两个人以虽然可以表示两个人以上的比赛结果上的比赛结果( (或两个以上的记录或两个以上的记录),),但没有分别表示两个记但没有分别表示两个记录那么直观、清晰录那么直观、清晰. . 1.1.做频率分布直方图做频率分布直方图, ,一般按以下步骤一般按以下步骤: : (1)(1)求极差求极差( (极差极差= =最大值最大值- -最小值最小值);); (2)(2)决定组距与组数决定组距与组数; ; (3)(3)决定分点决定分点; ; (4)(4)列频率分布表列频率分布表( (频率频率= =频数频数/ /样本容量样本容量);); (5)(5)绘制频率分布直方图绘制频率分布直方图. . 2.2.画频率分布直方图时应注意以下原则画频率分布直方图时应注意以下原则: : (1)(1)决定组距与组数决定组距与组数, ,将数据分组时将数据分组时, ,组数应为求合适组数应为求合适, ,以使数据的分布规律能较清楚地呈现出来以使数据的分布规律能较清楚地呈现出来. .这时应注意这时应注意: : 一般样本容量越大一般样本容量越大, ,所分组数越多所分组数越多; ; 为方便起见为方便起见, ,组距的选择应力求组距的选择应力求“取整取整”;”; 当样本容量不超过当样本容量不超过100100时时, ,按照数据的多少按照数据的多少, ,通常分通常分成成5 51212组组. . (2)(2)在频率分布直方图中在频率分布直方图中, ,纵轴表示纵轴表示 ,数据落在,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于面积总和等于1.1.组距组距频率频率