《2022年数据的收集与整理定义 .pdf》由会员分享,可在线阅读,更多相关《2022年数据的收集与整理定义 .pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十九讲数据的收集与整理一、课标下复习指南(一)数据的收集和整理1全面调查与抽样调查统计调查分全面调查和抽样调查两种,实际中常采用抽样调查的方式(1)考察全体对象的调查属于全面调查(2)从总体中抽取样本进行调查,属于抽样调查抽样调查是根据样本来估计总体的一种调查,简称抽查抽查体现了用样本估计总体的思想(3)总体、个体及样本总体:所要考察对象的全体,称为总体;个体:总体中的每一个考察对象,称为个体;样本:从总体中抽取的一部分个体,称为总体的一个样本样本中个体的数目称为样本容量说明抽样调查是实际中应用非常广泛的一种调查方式,它是从总体中抽取样本进行调查,根据样本来估计总体的一种调查;常采用问卷调查
2、等调查方式用划记法记录数据,通过表格整理数据,可以帮助我们找到数据的分布规律说明对于不同的抽样,可能得到不同的结果2频数与频率(1)频数:落在不同小组中的数据个数称为该组的频数(2)频数与数据总数的比称为频率频率反映了各组频数在总数中所占的百分比3几种常见的统计图表(1)条形图将数据按要求分成若干小组,并用“划记” 的方法统计出各小组的频数;再根据统计的频数画出条形图(2)扇形图将数据按要求分成若干小组,统计出各小组的频数,并算出各组的频数占数据总数的百分比;画一个圆,并规定圆的面积表示100;算出各百分数所对应的扇形的圆心角的度数,用量角器画出各扇形,并标出各百分数(3)折线图以横轴表示统计
3、的时间,纵轴表示数据,建立平面直角坐标系;在坐标平面内描点;用线段从左到右将这些点依次连接起来(4)频数分布直方图用频数分布直方图描述数据的一般步骤为:计算最大值与最小值的差;确定组距与组数;决定分点;列数频分布表;画频数分布直方图把数据按一定的规律分成组的个数为组数,每一组两个端点的差称为组距名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 11 页 - - - - - - - - - 1的整数部分组距最小值最大值组数;数据分组时,对数据要遵循“不重不漏”的原则,既不能有
4、一个数据同时落在两个组内重复出现的现象,也不能有一个数据不在任何组内的遗漏现象;频数分布直方图能够显示各组频数的分布情况,易于显示各组之间频数的差别(5)频数折线图频数折线图可以在频数分布直方图的基础上画出来取频数分布直方图中每一个矩形上边的中点,然后在横轴上取两个频数为0 的点,即在直方图的左边和右边各取一个频数为0 的点,再用线段从左到右将这些点依次连接起来说明利用统计图表示经过整理的数据,能更直观地反映数据规律(1)条形图:能显示具体数据,易于比较数据差别;(2)扇形图:用扇形的面积占圆的面积的百分比表示部分在总体中所占百分比,易于显示每组数据相对于总体的大小;(3)折线图:易于显示数据
5、的变化趋势;(4)直方图:能显示各组频数分布的情况,易于显示各组之间频数的差别(二)数据的分析1平均数、众数与中位数(1)算术平均数).(121nxxxnx(2)加权平均数如果一组数据中,x1,x2,x3,, , xk出现的次数分别是f1,f2,f3,, , fk,那么这组数据的加权平均数kkkfffffxfxfxfxx321332211(3)众数与中位数在一组数据中,出现次数最多的数据叫做这组数据的众数(一组数据的众数有时不止一个);将一组数据按从小到大(或从大到小 )的顺序排列,把处在最中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;众数、中位数和平均数从不同的角度描述了一
6、组数据的集中趋势(4)平均数、中位数、众数的特征平均数、中位数和众数都是数据的代表,它们刻画了一组数据的平均水平;平均数容易受极端值的影响,而中位数则不能充分利用所有数据的信息,众数在各个数据的重复次数大致相等时往往没有特别的意义2极差和方差、标准差(1)极差:一组数据中数据最大值减去最小值的差叫做这组数据的极差名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 11 页 - - - - - - - - - 极差用来反映一组数据变化范围的大小,是刻画数据离散程度的最简单的统计
7、量;极差受极端值的影响较大,不能反映中间数据的离散情况(2)方差:在一组数据x1,x2,x3,, , xn中,各数据与它的平均数x的差的平方和的平均数叫做这组数据的方差,即.)()()(1222212xxxxxxnsn方差是用来反映一组数据波动情况的特征数,常常用来比较两组数据的波动大小,方差越大,数据的波动越大;方差越小,数据的波动越小;方差的单位是原数据单位的平方(3)标准差:一组数据的方差的算术平方根叫做这组数据的标准差,即.2ss*标准差的计算公式:)()()(122221xxxxxxnsn说明(1)一组数据的众数可以不唯一,但一定出现在这组数据中;而一组数据的其他统计量都是唯一的,但
8、未必出现在这组数据中;(2)一组数据都在常数a 上下波动,即x1x1a,x2x2a,, , xnxna 时,平均数axx;方差 s2s2二、例题分析例 1 下列调查方式,合适的是( )A要了解一批灯泡的使用寿命,采用普查方式B要了解甘肃电视台“陇原风貌”栏目的收视率,采用普查方式C要保证“神舟六号”载人飞船成功发射,对重要零部件的检查采用抽查方式D要了解人们对环境的保护意识,采用抽查方式解D说明当一项调查具有破坏性或以现有的人力、物力、财力很难(或没有必要 )进行普查时,就选择抽查,对像“神舟六号”重要零部件的检查这类调查则必须选择普查例 2某校对 1200 名女生的身高进行了测量,身高在1.
9、 581. 63(单位: m)这一小组的频率为0. 25,则该组的人数为 ( )A150 人B300 个C 600人D900 人分析1200 名女生就有1200 个身高, 故数据总数为1200同理,该组的人数即为落在该组的数据个数,即该组的频数由频率频数数据总数得,频数频率数据总数0. 251200300故该组的人数为300 人故选 B名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 11 页 - - - - - - - - - 说明对频数与频率的考查大多数放置于数据处理的
10、背景之下,侧重于对概念的理解与运用,单独考查时一般以填空和选择的题型出现,但更多的是与统计图等结合考查例 3 我市某一周的最高气温统计如下表:最高气温 () 25 26 27 28 天数1 1 2 3 则这组数据的中位数与众数分别是( )A27,28B 27. 5, 28C28, 27D 26. 5, 27分析由上表可知,一共统计了7 个数据,将它们按从小到大排列为25,26,27,27,28,28,28,第4 个数据是 27,故这组数据的中位数是27()又数据28 出现的次数最多,所以众数是28()故选 A说明(1)求中位数时, 先看这组数据的个数是奇数还是偶数,然后将这组数据按从小到大的顺
11、序排列若有奇数个数据,则最中间那个数据就是这组数据的中位数;若有偶数个数据,则最中间两个数据的平均数即是这组数据的中位数;(2)求众数时,先数出各数据在这组数据中出现的次数,出现次数最多的数据就是这组数据的众数有时一组数据的众数不只一个例 4 某单位欲从内部招聘管理人员一名,对甲、乙、丙3 名候选人进行了笔试和面试两项测试,3 人的测试成绩如下表所示:测试项目测试成绩 /分甲乙丙笔试75 80 90 面试93 70 68 图 191 根据录用程序, 组织 200 名职工对三人利用投票推荐的方式进行民主评议,三人得票率 (没有弃权票, 每位职工只能推荐1 人)如图 191 所示,每得一票记作1
12、分(1)请算出三人的民主评议得分;(2)如果根据三颂测试的平均成绩确定录用人选,那么谁将被录用(精确到 0. 01)? (3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的433 比例确定个人成绩,那么谁将被录用 ?解(1)三人民主评议的得分分别为:甲20025 50(分),乙20040 80(分),丙2003570(分)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 11 页 - - - - - - - - - (2)按三项平均成绩计算,甲的成绩是31(759
13、350)72. 67,乙的成绩是31(807080)76. 67,丙的成绩是31(906870)76. 00乙的成绩最高,他将被录用(3)若笔试、面试、民主评议三项测试得分按433 的比例确定,三人的成绩分别为:.9 .72334350393475甲x.0.77334380370480乙x.4 .77334370368490丙x丙的成绩最高,他将被录用说明(1)计算加权平均数, 随着权数的不同, 结果可能不同 权数最大的数据对平均数的结果影响最大;(2)在实际问题中,往往采用加权平均数算法,而很少用算术平均数的算法例 5甲、乙两同学近期5 次百米跑测试成绩的平均数相同,甲同学成绩的方差2甲s4
14、,乙同学成绩的方差2乙s3. 1,则对他们测试成绩的稳定性判断正确的是( )A甲的成绩较稳定B乙的成绩较稳定C甲、乙成绩的稳定性相同D甲、乙成绩的稳定性无法比较分析因为方差越小,波动就越小,且2甲s2乙s,所以乙同学的成绩波动就小,即乙的成绩较稳定故选 B说明中考对极差、方差和标准差这三个统计量的考查,主要侧重于在实际情景中对其意义的理解,以及根据统计结果做出合理的判断和预测例 6 某校从甲、乙两名优秀选手中选择一名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8 狄,测试成绩如下表:(单位: s) 1 2 3 4 5 6 7 8 甲选手的成绩12. 1 12. 2 13. 0 1
15、2. 5 13. 1 12. 5 12. 4 12. 2 乙选手的成绩12. 0 12. 4 12. 8 13. 0 12. 2 12. 8 12. 3 12. 5 根据测试成绩,请你运用所学过的统计知识做出判断,派哪一位选手参加比赛更好?为什么 ?名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 11 页 - - - - - - - - - 解通过计算,可得甲x12. 5,乙x12. 5,2甲s 0. 12,2乙s0. 1025甲x乙x,两位选手的平均成绩相等又2甲s2乙
16、s,乙选手的成绩更稳定因此应该派乙选手去参加比赛说明(1)当用求平均数的方法(包括众数和中位数)无法比较两组数据的集中趋势时,还要用方差 (包括极差)进一步比较两组数据的波动情况;看谁的波动小,就说明谁更稳定(2)变式练习:在一次毕业考试中,某校九年级(1)、(2)两班学生数学成绩统计如下表:分数50 60 70 80 90 100 人(1)班3 5 16 3 11 12 数(2)班2 5 11 12 13 7 请你根据所学的统计知识,分别从平均数;众数;方差等不同的角度判断,综合分析这两个班中哪个班的考试成绩更加优秀解通过观察和计算,九年级 (1)班:平均数80,众数 70,方差 244;九
17、年级 (2)班:平均数80,众数 90,方差 180从平均数看,两个班考试成绩相当,不分优劣;从众数看(2)班成绩较好;从方差看(2)班成绩较稳定;综上所述 (2)班成绩更加优秀(3)比较的角度不同,所得结论不一定相同三、课标下新题展示例 7 某校为了解九年级学生体育测试成绩情况,以九年 (1)班学生的体育测试成绩为样本,按 A,B,C,D 四个等级进行统计, 并将统计结果绘成如下两幅统计图(见图 192), 请你结合图中所给信息解答下列问题:图 192 (说明: A 级:90 分 100 分; B 级: 75 分 89 分; C 级: 60 分74 分; D 级:60 分以下 ) (1)求出
18、 D 级学生的人数占全班总人数的百分比;(2)求出扇形统计图中C 级所在的扇形圆心角的度数;(3)该班学生体育测试成绩的中位数落在哪个等级内;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 11 页 - - - - - - - - - (4)若该校九年级学生共有500 人,请你估计这次考试中A 级和 B 级的学生共有多少人?解(1)4; (2)72; (3)B;(4)依题意知: A 级和 B 级学生的人数和占全班总人数的76,50076380,所以估计这次考试中A级和 B
19、 级的学生共有约380 人例 8 在第 49 届世界乒乓球锦标赛中,男子单打决赛在我国选手马琳和王励勤之间展开双方苦战七局,最终王励勤以43 获得胜利七局比分如下表:局数得分姓名一二三四五六七马琳11 11 5 11 8 9 6 王励勤9 7 11 8 11 11 11 (1)请将七局比分的相关数据的分析结果直接填入下表中(结果保留两个有效数字)项目分析结果姓名平均分众数中位数马琳8. 7 9. 0 王励勤11 (2)中央电视台在此次现场直播时,开展了“短信互动,有奖竞猜”活动,凡是参与短信互动且预测结果正确的观众,都能参加“乒乓大礼包”的抽奖活动据不完全统计,有32320 名观众参与了此次短
20、信互动活动,其中有50的观众预测王励勤获胜刘敏同学参加了本次“短信互动”活动,并预测了王励勤获胜,如果从中抽取20 名幸运观众,并赠送“乒乓大礼包”一份,那么刘敏同学中奖概率有多大?解(1)马琳得分的众数为11;王励勤得分的平均数为9.7,中位数为11(2)根据题意, 预测正确的观众总数为3232050 16160,他们成为幸运观众的可能性相同,而幸运观众数为 20,故刘敏中奖的概率为80811616020四、课标考试达标题(一)选择题1某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查你认为抽样比较合理的是 ( )A在公园调查了1000 名老年人的健康状况B在医院调查了
21、1000 名老年人的健康状况C调查了 10 名老年邻居的健康状况D利用派出所的户籍网随机调查了该地区10的老年人的健康状况名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 11 页 - - - - - - - - - 2图 193 中,用来表示不同品种的奶牛的平均产奶量最为合适的是( )图 193 3某地今年1 月 14 日每天的最高气温与最低气温如下表:日期1 月 1 日 1 月 2 日 1 月 3 日 1 月 4 日最高气温5404最低气温02 43其中温差最大的是(
22、)A1 月 1 日B 1 月 2 日C1 月 3 日D 1月 4 日4已知样本x1,x2,x3,x4的平均数是2,则 x13,x23,x33,x43 的平均数为 ( )A2 B2. 75 C 3 D5 5数学老师对小明参加的四次中考数学模拟考试成绩进行统计分析,判断小明的数学成绩是否稳定,因此老师需要知道小明这四次数学成绩的( )A平均数B众数 C中位数D方差6在 1000 个数据中,用适当的方法抽取了50 个数据作为样本进行统计频率分布表中,在 54.557. 4 这一组的频率是0.12,那么估计总体落在这一组之间的数据有( )A120 个B60 个C 12 个D6 个(二)填空题7在扇形统
23、计图中,占圆12的扇形的圆心角是_,圆心角是144的扇形占它所在圆的面积的_(填百分数 )8班主任为了解学生周末在家的学习情况,家访了班内的六位学生,了解到他们在家的学习时间如下表所名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 11 页 - - - - - - - - - 示那么这六位学生学习时间的众数是_,中位数是 _学生姓名小丽 小明 小颖小华小乐小恩学习时间(小时 ) 4 6 3 4 5 8 9数据 2, 1,0,1,2 的方差是 _10某生物小组11 人到校外采
24、集植物标本,其中有2 人每人采集到6 件,有 4 人每人采集到3 件,有 5 人每人采集到 4 件,则这个小组平均每人采集标本_件(三)解答题11宁波港是一个多功能、综合性的现代化大港,年货物吞吐量位居中国内地第二、世界排名第五,成功跻身于国际大港行列如图194 是宁波港 1994 年至 2004 年货物吞吐量统计图图 194 (1)从统计图中你能发现哪些信息,请说出两个;(2)有人判定宁波港货物吞吐量每两年间的增长率都不超过30,你认为他的说法正确吗?请说明理由12某校初一年级学生每人都只使用甲、乙、丙三种品牌中的一种计算器,图195 是该年级全体学生使用3 种不同品牌计算器人数的频率分布直
25、方图图 195 (1)求该校初一年级学生的总人数;(2)你认为哪种品牌计算器的使用频率最高?并求出这个频率名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 11 页 - - - - - - - - - (3)通过以上统计结果,请你给为学校供货的商家提出一条进货的合理化建议名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 11 页 - - - - - - - - - 参考答案第十九讲数据的收集与整理1D2D3D4D5 D6A743. 2,4084,4. 59210411(1)略;(2)不对;比如1994 年到 1996 年的年增长率为30. 6,超过了3012(1)2060120200(人);(2)丙牌使用频率最高,为%10020012060;(3)多进丙牌计算器名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 11 页 - - - - - - - - -
限制150内