第九章 第三节统计图表、数据的数字特征、用样本估计总体.ppt
《第九章 第三节统计图表、数据的数字特征、用样本估计总体.ppt》由会员分享,可在线阅读,更多相关《第九章 第三节统计图表、数据的数字特征、用样本估计总体.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 第三节第三节 统计图统计图表、数据的数字特征、表、数据的数字特征、用样本估计总体用样本估计总体1.1.统计图表的含义统计图表的含义(1 1)频率分布直方图)频率分布直方图频率分布直方图由一些小矩形来表示,每个小矩形的宽度为频率分布直方图由一些小矩形来表示,每个小矩形的宽度为_,高为,高为_,_,小矩形的面积恰为相应的小矩形的面积恰为相应的_,_,图中所有小矩形的面积之和为图中所有小矩形的面积之和为_._.xxi i(分组的宽度分组的宽度)频率频率f fi i1 1求极差(即一组数据中求极差(即一组数据中_与与_的差)的差)决定决定_与与_将数据将数据_列列_画画_作频率作频率分布
2、直分布直方图的方图的步骤步骤最大值最大值最小值最小值分组的宽度分组的宽度组数组数分组分组频率分布表频率分布表频率分布直方图频率分布直方图(2 2)频率折线图)频率折线图定义:在频率分布直方图中,按照分组原则,再在定义:在频率分布直方图中,按照分组原则,再在_和和_各加一个区间各加一个区间.从所加的左边区间的从所加的左边区间的_开始,用线段开始,用线段依次连接各个矩形的依次连接各个矩形的_,直至右边所加区间的,直至右边所加区间的_,就可以得到一条折线,我们称之为频率折线图就可以得到一条折线,我们称之为频率折线图.作用:可以用它来估计作用:可以用它来估计_情况情况.左边左边右边右边中点中点顶端中点
3、顶端中点中点中点总体的分布总体的分布(3 3)茎叶图)茎叶图茎叶图表示数据的优点茎叶图表示数据的优点()()茎叶图上茎叶图上_的损失的损失,所有的所有的_都可以从这都可以从这个茎叶图中得到个茎叶图中得到.()()茎叶图可以随时记录茎叶图可以随时记录,方便方便_._.茎叶图表示数据的缺点茎叶图表示数据的缺点当数据量很大或有多组数据时,茎叶图就不那么直观清晰了当数据量很大或有多组数据时,茎叶图就不那么直观清晰了.没有信息没有信息原始数据原始数据表示与比较表示与比较2.2.样本的数字特征样本的数字特征(1 1)众数、中位数、平均数)众数、中位数、平均数数字数字特征特征定义与求法定义与求法优点与缺点优
4、点与缺点众众数数一组数中一组数中_的数据的数据众数通常用于描述变量的值出众数通常用于描述变量的值出现次数最多的数现次数最多的数.但显然它对但显然它对其他数据信息的忽视使得无法其他数据信息的忽视使得无法客观地反映总体特征客观地反映总体特征出现次数最出现次数最多多数字数字特征特征定义与求法定义与求法优点与缺点优点与缺点中中位位数数一组从小到大(或从大一组从小到大(或从大到小)排列的数,若个到小)排列的数,若个数是奇数,数是奇数,_的数为中位数,若个数的数为中位数,若个数是偶数,中位数为是偶数,中位数为_中位数等分样本数据所占频率中位数等分样本数据所占频率,它不受少数几个极端值的影,它不受少数几个极
5、端值的影响,这在某些情况下是优点,响,这在某些情况下是优点,但它对极端值的不敏感有时也但它对极端值的不敏感有时也会成为缺点会成为缺点位于中间位于中间位位于中间两数的平均数于中间两数的平均数数字数字特征特征定义与求法定义与求法优点与缺点优点与缺点平平均均数数如果有如果有n n个数据个数据x x1 1,x x2 2,,x xn n,那么这那么这n n个个数的平均数数的平均数平均数和每一个数据都有关,平均数和每一个数据都有关,可以反映样本数据全体的信息可以反映样本数据全体的信息,但平均数受数据中的极端值,但平均数受数据中的极端值的影响较大,使平均数在估计的影响较大,使平均数在估计总体时可靠性降低总体
6、时可靠性降低 (2)(2)标准差、方差标准差、方差标准差:表示样本数据到平均数的一种平均距离,一般用标准差:表示样本数据到平均数的一种平均距离,一般用s s表示,表示,s=_.s=_.方差:标准差的平方方差:标准差的平方s s2 2叫作方差叫作方差.s s2 2=_=_,其中,其中x xn n(nN(nN*)是是_,n n是是_,是是_._.样本样本数据数据样本容量样本容量样本平均数样本平均数判断下面结论是否正确(请在括号中打判断下面结论是否正确(请在括号中打“”“”或或“”“”).(1)(1)平均数、众数与中位数从不同的角度描述了一组数据的集平均数、众数与中位数从不同的角度描述了一组数据的集
7、中趋势中趋势.().()(2)(2)一组数据的平均数一定大于这组数据中的每个数据一组数据的平均数一定大于这组数据中的每个数据.().()(3)(3)一组数据的标准差越大一组数据的标准差越大,说明这组数据的波动越大说明这组数据的波动越大.().()(4)(4)一组数据的众数可以是一个或几个,那么中位数也具有相一组数据的众数可以是一个或几个,那么中位数也具有相同的结论同的结论.().()(5)(5)从频率分布直方图得不出原始的数据内容,把数据表示成从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了直方图后,原有的具体数据信息就被抹掉了.().()(6)(6)茎
8、叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次小到大的顺序写,相同的数据可以只记一次.().()(7)(7)茎叶图只能表示有两位有效数字的数据茎叶图只能表示有两位有效数字的数据.().()【解析】【解析】(1)(1)正确正确.平均数表示一组数据的平均水平,众数表示平均数表示一组数据的平均水平,众数表示一组数据中出现次数最多的数,中位数等分样本数据所占频率一组数据中出现次数最多的数,中位数等分样本数据所占频率.(2)(2)错误错误.平均数一定不大于这组数据中的最大值平均数一定不大于这组数据中的最大值.(3)
9、(3)正确正确.由标准差的意义知结论正确由标准差的意义知结论正确.(4)(4)错误错误.中位数在一组数据中一定存在且唯一中位数在一组数据中一定存在且唯一.(5)(5)正确正确.由频率分布直方图的意义知结论正确由频率分布直方图的意义知结论正确.(6)(6)错误错误.茎叶图要求不能丢失数据茎叶图要求不能丢失数据.(7)(7)错误错误.茎叶图也能够记录有三个或三个以上的有效数字的数茎叶图也能够记录有三个或三个以上的有效数字的数据,只不过此时茎叶的选择要灵活据,只不过此时茎叶的选择要灵活.答案:答案:(1 1)(2 2)(3 3)(4 4)(5)(6)(7)(5)(6)(7)1.1.一个容量为一个容量
10、为3232的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.3750.375,则该,则该组样本的频数为组样本的频数为()()(A A)4 4 (B B)8 8 (C C)12 12 (D D)1616【解析】【解析】选选C.C.频数频数320.375320.37512.12.2.2.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的加了全部的7 7场比赛,平均得分均为场比赛,平均得分均为1616分,标准差分别为分,标准差分别为5.095.09和和3.723.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳,则甲、乙两
11、同学在这次篮球比赛活动中,发挥得更稳定的是定的是()()(A)(A)甲甲 (B)(B)乙乙(C)(C)甲、乙相同甲、乙相同 (D)(D)不能确定不能确定【解析】【解析】选选B.B.因为甲、乙两位同学的标准差分别为因为甲、乙两位同学的标准差分别为5.095.09和和3.723.72,5.095.093.723.72,所以乙同学发挥得更稳定,所以乙同学发挥得更稳定.3.3.如图是某学校抽取的学生体重的频率分布直方图,已知图中如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前从左到右的前3 3个小组的频率之比为个小组的频率之比为123123,第,第2 2小组的频数小组的频数为为1010
12、,则抽取的学生人数为,则抽取的学生人数为()()(A A)20 20 (B B)30 30 (C C)40 40 (D D)5050【解析】【解析】选选C.C.前前3 3组的频率之和等于组的频率之和等于1 1(0.012 5(0.012 50.037 5)0.037 5)550.750.75,第,第2 2小组的频率是小组的频率是 设样本容量为设样本容量为n n,则,则 即即 n n40.40.4.4.若某校高一年级若某校高一年级8 8个班参加合唱比赛的得分如茎叶图所示,个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是则这组数据的中位数和平均数分别是()()(A A)91.5
13、91.5和和91.5 91.5 (B B)91.591.5和和9292(C C)9191和和91.5 91.5 (D D)9292和和9292【解析】【解析】选选A.A.中位数为中位数为 (91 (9192)92)91.5.91.5.平均数为平均数为 (87 (8789899090919192929393949496)96)91.5.91.5.5.5.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是则甲、乙两人比赛得分的中位数之和是_._.【解析】【解析】甲比赛得分的中位数为甲比赛得分的中位数为282
14、8,乙比赛得分的中位数为,乙比赛得分的中位数为3636,所以甲、乙两人比赛得分的中位数之和为,所以甲、乙两人比赛得分的中位数之和为2828363664.64.答案:答案:6464考向考向 1 1 统计图表的应用统计图表的应用【典例【典例1 1】(1 1)()(20122012江西高考)小波一星期的总开支分布江西高考)小波一星期的总开支分布图如图图如图1 1所示,一星期的食品开支如图所示,一星期的食品开支如图2 2所示,则小波一星期的所示,则小波一星期的鸡蛋开支占总开支的百分比为鸡蛋开支占总开支的百分比为()()(A A)30%30%(B B)10%10%(C C)3%3%(D D)不能确定)不
15、能确定(2 2)从甲、乙两个品种的棉花中各抽测了)从甲、乙两个品种的棉花中各抽测了2525根棉花的纤维长根棉花的纤维长度(单位:度(单位:mmmm),结果如下:),结果如下:甲品种:甲品种:271 273 280 285 285 287 292271 273 280 285 285 287 292294 295 301 303 303 307 308 310 314294 295 301 303 303 307 308 310 314319 323 325 325 328 331 334 337 352319 323 325 325 328 331 334 337 352乙品种:乙品种:284
16、 292 295 304 306 307 312284 292 295 304 306 307 312313 315 315 316 318 318 320 322 322313 315 315 316 318 318 320 322 322324 327 329 331 333 336 337 343 356324 327 329 331 333 336 337 343 356由以上数据设计了茎叶图如图所示由以上数据设计了茎叶图如图所示 根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:写出两个统计结论:_;_;_.
17、_.(3)(3)(20122012广东高考改编)某校广东高考改编)某校100100名学生期中考试语文成绩名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:的频率分布直方图如图所示,其中成绩分组区间是:505060,6060,6070,7070,7080,8080,8090,9090,90100.100.求图中求图中的值的值.根据频率分布直方图,估计这根据频率分布直方图,估计这100100名学生语文成绩的平均分名学生语文成绩的平均分.若这若这100100名学生语文成绩某些分数段的人数(名学生语文成绩某些分数段的人数(x x)与数学成绩)与数学成绩相应分数段的人数(相应分数段的人
18、数(y y)之比如下表所示,求数学成绩在)之比如下表所示,求数学成绩在50509090之外的人数之外的人数.【思路点拨】【思路点拨】(1 1)由图)由图2 2求出小波一星期的食品开支,再由图求出小波一星期的食品开支,再由图1 1求出小波一星期的总开支,进而可求鸡蛋开支占总开支的百求出小波一星期的总开支,进而可求鸡蛋开支占总开支的百分比分比.(2)(2)从棉花的纤维长度的分布特点和平均长度两个方面进行比从棉花的纤维长度的分布特点和平均长度两个方面进行比较较.(3)(3)本小题根据每个区间上的矩形的面积和为本小题根据每个区间上的矩形的面积和为1 1,可建立关于,可建立关于的方程,解出的方程,解出的
19、值的值.由频率分布直方图求平均分:每个由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积的和区间的中点值乘以区间上矩形面积的和.本题关键是先把语本题关键是先把语文成绩在文成绩在505060,6060,6070,7070,7080,8080,809090的人数求出来,即根的人数求出来,即根据每段的频率求出每段的频数据每段的频率求出每段的频数.【规范解答】【规范解答】(1 1)选)选C.C.由图由图2 2知,小波一星期的食品开支为知,小波一星期的食品开支为300300元,其中鸡蛋开支为元,其中鸡蛋开支为3030元,而由图元,而由图1 1食品开支占总开支的食品开支占总开支的30%30%,故
20、小波一星期的总开支为,故小波一星期的总开支为 所以小波一星期所以小波一星期的鸡蛋开支占总开支的百分比为的鸡蛋开支占总开支的百分比为(2)(2)由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在维的长度比较集中(大部分集中在312312到到337337之间),还可以看之间),还可以看出乙的平均长度应大于出乙的平均长度应大于310310,而甲的平均长度要小于,而甲的平均长度要小于310310等,通等,通过分析可以得到答案过分析可以得到答案.答案:答案:甲棉花纤维的长度比较分散,乙棉花纤维的长度比较甲棉花纤维的长度比较分
21、散,乙棉花纤维的长度比较集中集中甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值(答案不唯一)(答案不唯一)(3)(3)由频率分布直方图知由频率分布直方图知(0.04+0.03+0.02+2)10=1,=0.005.(0.04+0.03+0.02+2)10=1,=0.005.550.05+650.4+750.3+850.2+950.05=73.550.05+650.4+750.3+850.2+950.05=73.所以平均分为所以平均分为73.73.分别求出语文成绩在分别求出语文成绩在50506060,60607070,70708080,808
22、09090的人的人数依次为数依次为0.05100=5,0.4100=40,0.3100=30,0.20.05100=5,0.4100=40,0.3100=30,0.2100=20.100=20.所以数学成绩在所以数学成绩在505060,6060,6070,7070,7080,8080,809090的人数依次为的人数依次为:5,20,40,25.:5,20,40,25.所以数学成绩在所以数学成绩在50509090之外的人数有之外的人数有100-(5+20+40+25)100-(5+20+40+25)=10(=10(人人).).【拓展提升】【拓展提升】各种统计图表的优点与不足各种统计图表的优点与不
23、足【变式训练】【变式训练】(1 1)为了了解某地区高三学生的身体发育情况,)为了了解某地区高三学生的身体发育情况,抽查了该地区抽查了该地区100100名年龄为名年龄为17.517.51818岁的男生的体重岁的男生的体重(kg),(kg),得得到频率分布直方图如下:到频率分布直方图如下:根据上图可得这根据上图可得这100100名学生中体重在名学生中体重在56.556.564.5 kg64.5 kg的学生人数的学生人数是是()()(A A)20 20 (B B)30 30 (C C)40 40 (D D)5050【解析】【解析】选选C.C.体重在体重在56.556.564.5 kg64.5 kg的
24、学生的累计频率为的学生的累计频率为20.0320.0320.0520.0520.0520.0520.07=0.420.07=0.4,则体重在,则体重在56.556.564.5 kg64.5 kg的学生人数为的学生人数为0.4100=40.0.4100=40.(2 2)为了调查甲、乙两个网站受欢迎的程度,随机选取了)为了调查甲、乙两个网站受欢迎的程度,随机选取了1414天,统计上午天,统计上午8 8:00001010:0000各自的点击量,得到如图所示的各自的点击量,得到如图所示的茎叶图,求茎叶图,求甲网站点击量在甲网站点击量在10104040间的频率是多少?间的频率是多少?甲、乙两个网站哪个更
25、受欢迎?请说明理由甲、乙两个网站哪个更受欢迎?请说明理由.【解析】【解析】甲网站点击量在甲网站点击量在10104040间的频率为间的频率为甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.考向考向 2 2 数字特征的应用数字特征的应用【典例【典例2 2】(1 1)()(20122012陕西高考)从甲、乙两个城市分别随陕西高考)从甲、乙两个城市分别随机抽取机抽取1616台自动售货机,对其销售额进行统计,统计数据用茎台自动售货机,对其销
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 第三节 统计图表、数据的数字特征、用样本估计总体 第九 三节 统计 图表 数据 数字 特征 样本 估计 总体
限制150内