20数据分析复习课.ppt
《20数据分析复习课.ppt》由会员分享,可在线阅读,更多相关《20数据分析复习课.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据的分析数据的分析复习课复习课 知识网络:知识网络:知识点的知识点的回顾回顾数据的代表数据的代表数据的波动数据的波动平均数平均数中位数中位数众众 数数极极 差差方方 差差用用样样本本估估计计总总体体用样本平均数估用样本平均数估计总体平均数计总体平均数用样本方差估计用样本方差估计总体方差总体方差问题问题1:求加权平均数的公式是什么?:求加权平均数的公式是什么?在求在求n个数的算术平均数时,如果个数的算术平均数时,如果x1出现出现f1次,次,x2出现出现f2次,次,xk出现出现fk次(这里次(这里f1+f2+fk=n)那么这那么这n个数的算术平均数个数的算术平均数若若n个数个数的权的权分别是分别
2、是则:则:叫做这叫做这n个数的个数的加权平均数加权平均数。将一组数据按照由小到大(或由大到小)的顺序排将一组数据按照由小到大(或由大到小)的顺序排列如果数据的个数是奇数,则处于中间位置的数就是这列如果数据的个数是奇数,则处于中间位置的数就是这组数据的组数据的中位数中位数。如果数据的个数是偶数,则中间两个如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的数据的平均数就是这组数据的中位数中位数。中位数是一个位置代表值。如果已知一组数据的中中位数是一个位置代表值。如果已知一组数据的中位数,那么可以知道,小于等于或大于等于这个中位数位数,那么可以知道,小于等于或大于等于这个中位数的数据各占一半
3、。的数据各占一半。一组数据中出现次数最多的数据就是这组数据的一组数据中出现次数最多的数据就是这组数据的众数众数。平均数、中位数、众数比较平均数、中位数、众数比较1、联系:平均数、中位数和众数都可以作为一组数据的代表,是描述一组数据集中趋势的量,平均数是应用较多的一种量。实际问题中求得的平均数、众数、中位数应带上相应的单位。2、区别:平均数计算要用到所有数据,它能充分利用所有的数据信息,任何一个数据的变动都会相应引起平均数的变动,并且它受极端值的影响较大;中位数仅与数据的排列位置有关,某些数据的移动对中位数没有影响,中位数可能出现在所给数据中也可能不在所给的数据中,当一组数据中的个别数据变动较大
4、时,可用中位数描述其趋势;众数是当一组数据中某一数据重复出现较多时,人们往往关心的一个量,众数不受极端值的影响,它是它的一个优势。极差:极差:一组数据中最大数据与最小数据的差。一组数据中最大数据与最小数据的差。极差是最简单的一种度量数据波动情况的量极差是最简单的一种度量数据波动情况的量,但只但只能反映数据的波动范围能反映数据的波动范围,不能衡量每个数据的变化不能衡量每个数据的变化情况情况,而且受极端值的影响较大而且受极端值的影响较大.各数据与平均数的差的平方的平均数叫做这批各数据与平均数的差的平方的平均数叫做这批数据的数据的方差方差。公式为:。公式为:方差越小,波动越小。方差越大,波动越大。方
5、差越小,波动越小。方差越大,波动越大。2.2.某校五个绿化小组一天植树的棵数如下:某校五个绿化小组一天植树的棵数如下:1010,1010,1212,x,8 8。已知这组数据的众数与平均数相等,那么已知这组数据的众数与平均数相等,那么这组数据的中位数是(这组数据的中位数是()(A)A)x=8 (=8 (B)B)x=9 (=9 (C)C)x=10 (=10 (D)D)x=12=12C3.3.某班某班5050名学生身高测量结果如下:名学生身高测量结果如下:1.1.1010名学生的体重分别是名学生的体重分别是4141,4848,5050,5353,4949,5050,5353,5151,6767(单位
6、:(单位:kgkg),),这组数据的极差是(这组数据的极差是()(A A)27 27 (B B)26 26 (C C)25 25 (D D)2424BC细心选一选细心选一选身高身高1.511.521.531.541.551.561.571.581.591.601.64人数人数113434468106该班学生身高的众数和中位数分别是该班学生身高的众数和中位数分别是()()(A A)1.60,1.56 1.60,1.56 (B B)1.59,1.58 1.59,1.58 (C C)1.60,1.58 1.60,1.58 (D D)1.60,1.601.60,1.605.5.甲、乙两班举行电脑汉字输
7、入比赛,参赛学生每分钟输入汉甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟输入汉字的个数统计结果如下表:字的个数统计结果如下表:某同学分析上表后得出如下结论:某同学分析上表后得出如下结论:甲、乙两班学生成绩平均水平相同;甲、乙两班学生成绩平均水平相同;乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字150个为优秀);个为优秀);甲班成绩的波动比乙班大,上述结论正确的是(甲班成绩的波动比乙班大,上述结论正确的是()4.4.如果一组数据如果一组数据a1,a2,an的方差是的方差是2 2,那么一组新,那么一组新数数2a1,2a2,2an的方差是(的方差
8、是()(A A)2 2 (B B)4 4 (C C)8 8 (D D)1616CA(A)(B)(C)(D)班级班级参加人数参加人数中位数中位数方差方差平均数平均数甲甲55149191135乙乙55151110135填一填填一填1 1、为了调查某一路汽车流量,记录了、为了调查某一路汽车流量,记录了、为了调查某一路汽车流量,记录了、为了调查某一路汽车流量,记录了3030天中每天同一时段通天中每天同一时段通天中每天同一时段通天中每天同一时段通过该路口的汽车辆数,其中过该路口的汽车辆数,其中过该路口的汽车辆数,其中过该路口的汽车辆数,其中4 4天是天是天是天是284284辆,辆,辆,辆,4 4天是天是
9、天是天是290290辆,辆,辆,辆,1212天天天天是是是是312312辆,辆,辆,辆,1010天是天是天是天是314314辆,那么这辆,那么这辆,那么这辆,那么这3030天该路口同一时段通过的天该路口同一时段通过的天该路口同一时段通过的天该路口同一时段通过的汽车平均数为汽车平均数为汽车平均数为汽车平均数为 。2 2、小芳测得连续、小芳测得连续、小芳测得连续、小芳测得连续5 5天日最低气温并整理后得出下表:天日最低气温并整理后得出下表:天日最低气温并整理后得出下表:天日最低气温并整理后得出下表:由于不小心被污染了两个数据,这两个数据分别是由于不小心被污染了两个数据,这两个数据分别是由于不小心被
10、污染了两个数据,这两个数据分别是由于不小心被污染了两个数据,这两个数据分别是 、。日期日期日期日期一一一一二二二二三三三三四四四四五五五五方差方差方差方差平均气温平均气温平均气温平均气温最低气温最低气温最低气温最低气温1 13 32 25 53 33 3、某地两校联谊文艺晚会上甲、乙两个文艺节目均由、某地两校联谊文艺晚会上甲、乙两个文艺节目均由、某地两校联谊文艺晚会上甲、乙两个文艺节目均由、某地两校联谊文艺晚会上甲、乙两个文艺节目均由1010个演员个演员个演员个演员表演,他们的年龄(岁)分别如下:表演,他们的年龄(岁)分别如下:表演,他们的年龄(岁)分别如下:表演,他们的年龄(岁)分别如下:甲
11、节目:甲节目:甲节目:甲节目:13 13,1313,1414,1515,1515,1515,1515,1616,1717,1717乙节目:乙节目:乙节目:乙节目:5 5,5 5,6 6,6 6,6 6,6 6,7 7,7 7,5050,5252(1 1)甲节目中演员年龄的中位数是)甲节目中演员年龄的中位数是)甲节目中演员年龄的中位数是)甲节目中演员年龄的中位数是 ;乙节目中演员年龄;乙节目中演员年龄;乙节目中演员年龄;乙节目中演员年龄的众数是的众数是的众数是的众数是 。(。(。(。(2 2)两个节目中,演员年龄波动较小的是)两个节目中,演员年龄波动较小的是)两个节目中,演员年龄波动较小的是)两
12、个节目中,演员年龄波动较小的是 。3064 2156甲节目中演员的年龄甲节目中演员的年龄年收入(万元)所占户数比 1.1.某同学进行社某同学进行社会调查,随机会调查,随机抽查某地区抽查某地区2020个家庭的收入个家庭的收入情况,并绘制情况,并绘制了统计图请根了统计图请根据统计图给出据统计图给出的信息回答:的信息回答:(1)填写下表)填写下表年收入(万元年收入(万元)0.6 0.9 1.0 1.1 1.2 1.3 1.49.7家庭户数家庭户数 这这20个家庭的年平均收入为个家庭的年平均收入为万元。万元。(2).数据中的中位数是数据中的中位数是万元,众数是万元,众数是万元。万元。112345311
13、.61.21.32、某公司招聘职员,对甲、乙两位候选人进行了面试和笔试,面试包括形、某公司招聘职员,对甲、乙两位候选人进行了面试和笔试,面试包括形体和口才,笔试中包括专业水平和创新能力考察,他们的成绩(百分制)如体和口才,笔试中包括专业水平和创新能力考察,他们的成绩(百分制)如下表下表(1)若公司根据经营性质和岗位要求认为:形体、口才、专业水平、创)若公司根据经营性质和岗位要求认为:形体、口才、专业水平、创新能力按照新能力按照5:5:4:6的比确定,请计算甲、乙两人各自的平均成绩,的比确定,请计算甲、乙两人各自的平均成绩,看看谁将被录取?看看谁将被录取?候选人候选人面试面试笔试笔试形体形体口才
14、口才专业水平专业水平创新能力创新能力甲甲86909692乙乙92889593解:(解:(1)乙将被录取。乙将被录取。(1)(2)的结果的结果不一样说明了不一样说明了什么?什么?在加权平均数中在加权平均数中,由于权的不同由于权的不同,导致了结果的相异导致了结果的相异候选人候选人面试面试笔试笔试形体形体口才口才专业水平专业水平创新能力创新能力甲甲86909692乙乙92889593(2)若公司根据经营性质和岗位要求认为:面试成绩中形体占)若公司根据经营性质和岗位要求认为:面试成绩中形体占5%,口,口才占才占30%,笔试成绩中专业水平点,笔试成绩中专业水平点35%,创新能力点,创新能力点30%,那么
15、你认为,那么你认为该公司会录取谁?该公司会录取谁?解:(解:(2)甲将被录取。甲将被录取。3.当今,青少年视力水平下降已引起社会的关注,为了了解某当今,青少年视力水平下降已引起社会的关注,为了了解某校校3000名学生的视力情况,从中抽取了一部分学生进行了一次名学生的视力情况,从中抽取了一部分学生进行了一次抽样调查,利用所得的数据绘制的直方图(长方形的高表示该抽样调查,利用所得的数据绘制的直方图(长方形的高表示该组人数)如下:组人数)如下:3.953.955040302010 x(视力视力)y(人数)人数)(1)本次抽样抽查共抽测了多少名学生?)本次抽样抽查共抽测了多少名学生?(2)参加抽测的学
16、生的视力的众数在什么范围内?)参加抽测的学生的视力的众数在什么范围内?4.254.25 4.554.55 4.854.85 5.155.15 5.455.45(3)若视力为)若视力为4.9,5.0,5.1及以上为正常,及以上为正常,试估计该校视力正常的人数约为多少?试估计该校视力正常的人数约为多少?解:(解:(1)3050402010150(人)(人)(2)4.254.55(3)4.4.某农民几年前承包了甲、乙两片荒山,各栽种了某农民几年前承包了甲、乙两片荒山,各栽种了100100棵蜜橘,棵蜜橘,成活成活98%98%。现已挂果,经济效益初步显现,为了分析经营情况,。现已挂果,经济效益初步显现,
17、为了分析经营情况,他从甲山随意采摘了他从甲山随意采摘了3 3棵树上的蜜橘,称得质量分别为棵树上的蜜橘,称得质量分别为2525,1818,2020千克;他从乙山上采摘了千克;他从乙山上采摘了4 4棵树上的蜜橘,称得质量分别是棵树上的蜜橘,称得质量分别是2121,2424,1919,2020千克,组成一个样本,问:千克,组成一个样本,问:(1 1)样本容量是多少?)样本容量是多少?(2 2)样本平均数是多少?并估算出甲、乙两山蜜橘的总产量?)样本平均数是多少?并估算出甲、乙两山蜜橘的总产量?(3 3)甲、乙两山哪个山上蜜橘长势较整齐?)甲、乙两山哪个山上蜜橘长势较整齐?总产量为:总产量为:2120
18、098%4116(千克)(千克)(2)解解(1)样本容量为样本容量为347;所以乙山上橘子长势比较整齐。所以乙山上橘子长势比较整齐。(3)易得:易得:5、某商场统计了每个营业员在某月的销售额,统计图如下:、某商场统计了每个营业员在某月的销售额,统计图如下:销售额销售额x(万元)万元)人人数数(n)解答下列问题:解答下列问题:(1)设营业员的月销售额为)设营业员的月销售额为x(万元),万元),商场规定:当商场规定:当x15时为不称职,时为不称职,当当15x20时,为基本称职,时,为基本称职,当当20 x25为称职,为称职,当当x25时为优秀,时为优秀,试求出不称职、基本称职、称职、优秀试求出不称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 20 数据 分析 复习
限制150内