《数据分析复习PPT学习教案.pptx》由会员分享,可在线阅读,更多相关《数据分析复习PPT学习教案.pptx(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1数据分析复习数据分析复习(fx)第一页,共33页。自主复习:自主复习:1.算术平均数(定义,公式)算术平均数(定义,公式)2.加权平均数(定义公式)加权平均数(定义公式)3.中位数(数据个数奇数个偶数个的区别)中位数(数据个数奇数个偶数个的区别)4.众数(一定只有一个吗?)众数(一定只有一个吗?)5.离散程度(定义)离散程度(定义)6.方差方差(fn ch)(定义,公式,描述的是什么?)(定义,公式,描述的是什么?)第1页/共33页第二页,共33页。1.算算术术(sunsh)平平均数均数:一组数据一组数据(shj)的总和与这组数据的总和与这组数据(shj)的个数之比叫做这组数据的个数之
2、比叫做这组数据(shj)的算术平均数的算术平均数.2.计计算算公公式式:x=x1+x2+x3+xnn3.算术平均数算术平均数:是反映一组数据的平均水平是反映一组数据的平均水平 情况的量情况的量.第2页/共33页第三页,共33页。加权平均数:在实际生活中,一组数据中各个加权平均数:在实际生活中,一组数据中各个(gg)数据的重要程度是不同的,所以我们在计数据的重要程度是不同的,所以我们在计算这组数据的平均数的时候往往根据其重要程度,算这组数据的平均数的时候往往根据其重要程度,分别给每个数据一个分别给每个数据一个“权权”。这样,计算出来的平。这样,计算出来的平均数叫做加权平均数。均数叫做加权平均数。
3、加权平均数加权平均数加权平均数加权平均数第3页/共33页第四页,共33页。老师老师(losh)对同学们每学期总评成绩是这样做的对同学们每学期总评成绩是这样做的:平时平时练习占练习占 30%,期中考试占期中考试占30%,期末考试占期末考试占40%.某同学某同学(tng xu)平平时练习时练习93 分分,期中考试期中考试87分分,期末考试期末考试(q m ko sh)95分分,那么如何来评那么如何来评定该同学的定该同学的 学期总评成绩呢学期总评成绩呢?解解:该同学的学期总评成绩是该同学的学期总评成绩是:9330%=92(分分)+9540%8730%+加权平均数加权平均数加权平均数加权平均数权权权权
4、 数数数数权数的意义权数的意义权数的意义权数的意义:各个数据在该组数据中所占的比例各个数据在该组数据中所占的比例.加权平均数的意义加权平均数的意义加权平均数的意义加权平均数的意义:按各个数据的权数大小来反映该组数据的总体平均量按各个数据的权数大小来反映该组数据的总体平均量按各个数据的权数大小来反映该组数据的总体平均量按各个数据的权数大小来反映该组数据的总体平均量 第4页/共33页第五页,共33页。解:先确定解:先确定(qudng)(qudng)这组数据中这组数据中1.601.60,1.641.64,1.681.68的的权数?权数?例题:有一组数据例题:有一组数据(shj)(shj)如下:如下:
5、1.601.60,1.601.60,1.601.60,1.641.64,1.641.64,1.681.68,1.681.68,1.68.1.68.求出这求出这组数据组数据(shj)(shj)的的加权平均数加权平均数.第5页/共33页第六页,共33页。一家公司对一家公司对A A、B B、C C三名应聘者进行了创新、综合知识和三名应聘者进行了创新、综合知识和语言三项素质测试语言三项素质测试(csh)(csh),他们的成绩如下表所示:,他们的成绩如下表所示:测试项目测试项目 测试成绩测试成绩 A B C 创新创新 72 85 67综合知识综合知识 50 74 70 语言语言 88 45 67 (2
6、2)如果根据实际需要,广告公司给出了选人标准:将创新、)如果根据实际需要,广告公司给出了选人标准:将创新、综合知识综合知识和语言三项测试和语言三项测试(csh)(csh)得分按得分按4 4:3 3:1 1的比例确定各人的测试的比例确定各人的测试(csh)(csh)成绩。成绩。你选谁?你选谁?(1 1)如果)如果(rgu)(rgu)根据三项测试的平均成绩确定录用入选,你选谁?根据三项测试的平均成绩确定录用入选,你选谁?第6页/共33页第七页,共33页。解:(解:(1)A的平均成绩为(的平均成绩为(72+50+88)/3=70分。分。B的平均成绩为(的平均成绩为(85+74+45)/3=68分。分
7、。C的平均成绩为(的平均成绩为(67+70+67)/3=68分。分。由于由于(yuy)7068,故,故A将被录用。将被录用。(2)根据(gnj)题意,A的成绩为:72 +50 +88 =65.75分。B的成绩为:85 +74 +45 =75.875分。C的成绩为:67 +70 +67 =68.125分。因此候因此候选人选人(xun(xun rn)Brn)B将将 被录用被录用第7页/共33页第八页,共33页。由(由(1)()(2)的结果不一样,)的结果不一样,说明了:说明了:权数的设置直接影响着平均数,权数的设置直接影响着平均数,算术平均数实际上给每个数设置的权数是相同算术平均数实际上给每个数设
8、置的权数是相同(xin tn)的的权数越大这个数对平均数影响越大权数越大这个数对平均数影响越大第8页/共33页第九页,共33页。n n小明家的超市新进了三种糖小明家的超市新进了三种糖小明家的超市新进了三种糖小明家的超市新进了三种糖果果果果(tnggu(tnggu),应顾客要求,应顾客要求,应顾客要求,应顾客要求,妈妈打算把糖果妈妈打算把糖果妈妈打算把糖果妈妈打算把糖果(tnggu(tnggu)混合成杂拌糖出售,具体进混合成杂拌糖出售,具体进混合成杂拌糖出售,具体进混合成杂拌糖出售,具体进价和用量如下表:价和用量如下表:价和用量如下表:价和用量如下表:种类种类售价售价质量质量甲甲24元元/千克千
9、克2千克千克乙乙19元元/千克千克2千克千克丙丙28元元/千克千克6千克千克你能帮小明的妈妈计算你能帮小明的妈妈计算(j sun)出杂拌糖的售价出杂拌糖的售价吗吗?第9页/共33页第十页,共33页。n n小明小明小明小明(xi(xi o mno mn)帮妈妈计算出了杂拌糖的帮妈妈计算出了杂拌糖的帮妈妈计算出了杂拌糖的帮妈妈计算出了杂拌糖的售价为:售价为:售价为:售价为:种类种类售价售价质量质量甲甲24元元/千克千克2千克千克乙乙19元元/千克千克2千克千克丙丙28元元/千克千克6千克千克 思考思考(sko):你认为小明的做法有道理吗:你认为小明的做法有道理吗?为什么为什么?想一想正确正确(zh
10、ngqu)解答:解答:240.2+190.2+280.6=25.4也可以这样计算:也可以这样计算:第10页/共33页第十一页,共33页。练习:如果三种练习:如果三种(sn zhn)糖果的进价不变,糖果的进价不变,每种糖果的用量发生改变,如下表所示:请你分每种糖果的用量发生改变,如下表所示:请你分别计算出杂拌糖的保本价别计算出杂拌糖的保本价种类种类售价售价用量用量甲甲24元元/千千克克2千克千克乙乙19元元/千千克克6千克千克丙丙28元元/千千克克2千克千克种类种类售价售价用量用量甲甲24元元/千克千克6千克千克乙乙19元元/千克千克2千克千克丙丙28元元/千克千克2千克千克思考思考:为什么三种
11、为什么三种(sn zhn)(sn zhn)糖的售价没变,杂拌糖的定价却不糖的售价没变,杂拌糖的定价却不同?同?种类种类售价售价用量用量甲甲24元元/千克千克2千克千克乙乙19元元/千克千克2千克千克丙丙28元元/千克千克6千克千克1、240.2+190.2+280.6=25.42、240.6+190.2+280.2=23.83、240.2+190.6+280.2=21.8也可以按下面方法进也可以按下面方法进行行(jnxng)计算计算第11页/共33页第十二页,共33页。1、一组数据、一组数据(shj)为为10,8,9,12,13,10,8,则这组数据,则这组数据(shj)的平均数是的平均数是2
12、、已知已知 的平均数为的平均数为6 6,则,则3、4个数的平均数是个数的平均数是6,6个数的平均数是个数的平均数是11,则这几个,则这几个(j)数的平均数是数的平均数是4、在一次满分、在一次满分(mn fn)制为制为5分的数学测验中,某班男同学中有分的数学测验中,某班男同学中有10个得个得5分,分,5个得个得4分,分,4个得个得 3分,分,2个得个得1分,分,4个得个得0分,则这个班男生的平均分为分,则这个班男生的平均分为5、园园参加了园园参加了4门功课的考试,平均成绩是门功课的考试,平均成绩是82分,若计划在下一门功课考完后,使分,若计划在下一门功课考完后,使5门功课成绩平均分为门功课成绩平
13、均分为85分,那么她下一门功课至少应得的分数为分,那么她下一门功课至少应得的分数为练习题一练习题一7、已知数据、已知数据x1,x2,x3的平均数为的平均数为a,数据,数据y1,y2,y3的平均数为的平均数为b,则数据,则数据3x1+y1,3x2+y2,3x3+y3的平均数为的平均数为 5、有、有100个数,它们的平均数为个数,它们的平均数为78.5,现在将其中的两个数,现在将其中的两个数82和和26去掉,则去掉,则现在余下来的数的平均数是现在余下来的数的平均数是_。6、若、若3、4、5、6、a、b、c的平均数是的平均数是12,则,则abc_第12页/共33页第十三页,共33页。中位数定义中位数
14、定义(dngy)(dngy):把一组数据从小到大的顺序排列,:把一组数据从小到大的顺序排列,位于中间的数称为这组数据的中位数位于中间的数称为这组数据的中位数.如果数据的个数是偶数个时,那么位于中间如果数据的个数是偶数个时,那么位于中间(zhngjin)位置的两个位置的两个数的平均数称为这组数据的中位数数的平均数称为这组数据的中位数.如果数据的个数是奇数如果数据的个数是奇数(j sh)个,那么恰好位于中间的数就是这组数据的个,那么恰好位于中间的数就是这组数据的中位数中位数.中位数把一组数据分成相同数目的两部分,其中一部分都小于或等于中中位数把一组数据分成相同数目的两部分,其中一部分都小于或等于中
15、位数,而另一部分都大于或等于中位数位数,而另一部分都大于或等于中位数 因此,中位数常用来描述因此,中位数常用来描述“中间位置中间位置”或或“中等水平中等水平”,但中,但中位数没有利用数据组中所有的信息位数没有利用数据组中所有的信息.第13页/共33页第十四页,共33页。例例 找出下列找出下列(xili)两组数据的中位数:两组数据的中位数:举举例例(1)14,11,13,10,17,16,28;(2)453,442,450,445,446,457,448,449,451,450第14页/共33页第十五页,共33页。解解 先把这组数据从小到大排列:先把这组数据从小到大排列:10,11,13,14,
16、16,17,28 位于位于(wiy)中间的数是中间的数是14,因此这组数据的,因此这组数据的中位数是中位数是14.中位数中位数(1)14,11,13,10,17,16,28;第15页/共33页第十六页,共33页。解解 把这组数据从小到大排列:把这组数据从小到大排列:442,445,446,448,449,450,450,451,453,457 位于位于(wiy)中间的两个数是中间的两个数是449和和450,这两个数的平均,这两个数的平均数是数是 449.5,因此这组数据的中位数是,因此这组数据的中位数是449.5.中间中间(zhngjin)的的两个数两个数(2)453,442,450,445,
17、446,457,448,449,451,450.第16页/共33页第十七页,共33页。练习练习1.求下列求下列(xili)各组数据的中位数:各组数据的中位数:(1)100,75,80,73,50,60,70;解解把这组数据从小到大排列:把这组数据从小到大排列:50,60,70,73,75,80,100位于中间的数是位于中间的数是73,因此这组数据的中位数是,因此这组数据的中位数是73.第17页/共33页第十八页,共33页。2.求下面求下面(xi mian)一组数据的中位数和平均数:一组数据的中位数和平均数:17,12,5,9,5,14;解解把这组数据从小到大排列:把这组数据从小到大排列:5,5
18、,9,12,14,17位于中间的数是位于中间的数是9和和12,这两个数的平均数是,这两个数的平均数是10.5,因此,因此这组数据的中位数是这组数据的中位数是10.5;这组数据的平均数是:这组数据的平均数是:(17+12+5+9+5+14)6=10.3第18页/共33页第十九页,共33页。众数的定义:在一组数据中,把出现众数的定义:在一组数据中,把出现(chxin)次数最多的次数最多的数叫做这组数据的众数数叫做这组数据的众数.(允许一组数据有多个出现(允许一组数据有多个出现(chxin))举例:下面是一家举例:下面是一家(y ji)鞋店在一段时间内各种尺码的男鞋鞋店在一段时间内各种尺码的男鞋的销
19、售情况统计表:的销售情况统计表:鞋的尺码鞋的尺码(cm)2323.52424.52525.52626.5销售量销售量(双双)56613171084试求出这家鞋店数据试求出这家鞋店数据(shj)中的众数中的众数 、中位数、中位数 .2525第19页/共33页第二十页,共33页。练习练习1.求下列求下列(xili)各组数据的众各组数据的众数:数:(1)3,4,4,5,3,5,6,5,6;解解根据题意可知,根据题意可知,5出现的次数最多,出现的次数最多,因此,因此,5是这组数据的众数是这组数据的众数.第20页/共33页第二十一页,共33页。(2)1.0,1.1,1.0,0.9,0.8,0.9,1.1
20、,0.9解解根据题意可知,根据题意可知,0.9出现的次数最多,因此,出现的次数最多,因此,0.9是这组数据的众数是这组数据的众数.第21页/共33页第二十二页,共33页。2.某班某班30人所穿运动服尺码的情况为:穿人所穿运动服尺码的情况为:穿75号码的有号码的有5人,人,穿穿80号码的有号码的有6人,穿人,穿85号码的有号码的有15人,穿人,穿90号码的有号码的有3人,穿人,穿95号码的有号码的有1人人.穿哪一种尺码衣服穿哪一种尺码衣服(y fu)的人最的人最多?这个数据称为什么数?多?这个数据称为什么数?解解根据题意可知,穿根据题意可知,穿85号衣服的人最多号衣服的人最多.因此因此85号是这
21、组衣服尺码数据的众数号是这组衣服尺码数据的众数.第22页/共33页第二十三页,共33页。1.某部队一位新兵连续某部队一位新兵连续(linx)射靶射靶5次,命中环数如下:次,命中环数如下:0,2,5,2,7,这组数的中位数是,这组数的中位数是()A0 B2 C5 D72某篮球队某篮球队12名队员年龄如下:则这名队员年龄如下:则这12名队员的中位名队员的中位数是数是()A19 B20 C21 D22年龄(岁)18 19 20 21 22人数14322练习题二练习题二BB第23页/共33页第二十四页,共33页。4.已知数据已知数据(shj)1、2、x、5的平均数为的平均数为2.5,则这组,则这组数据
22、数据(shj)的中位数与众数分别是的中位数与众数分别是_、_。223一组数据从小到大排列为一组数据从小到大排列为10,3,0,8,10,15。如果通过增大数据如果通过增大数据10来改变来改变(gibin)该数据的中位数,那么至该数据的中位数,那么至少使其大于少使其大于()AO B3 C8 D10 D第24页/共33页第二十五页,共33页。5.某公司有某公司有15名员工,他们所在的部门及相应每人所创的年利名员工,他们所在的部门及相应每人所创的年利润润(lrn)如下表所示:如下表所示:部门部门ABCDEFG人数人数(个个)1124223利润利润(万元万元)2052.5 2.1 1.51.51.2求
23、该公司每人所创年利润的平均数求该公司每人所创年利润的平均数()万元和中位数万元和中位数()万元;万元;你认为使用平均数和中位数中哪一个你认为使用平均数和中位数中哪一个(y)来描述来描述该公司每人所创年利润的一般水平比较合理该公司每人所创年利润的一般水平比较合理?()中位数中位数3.22.1第25页/共33页第二十六页,共33页。为了反映一组数据的离散程度,可以采用为了反映一组数据的离散程度,可以采用(ciyng)(ciyng)很很多方法,统计中常采用多方法,统计中常采用(ciyng)(ciyng)以下做法:以下做法:方差方差(fn ch)(fn ch)的定义:设一组数据为的定义:设一组数据为x
24、1x1,x2x2,xnxn,各数据与各数据与 平均数平均数 之差的平方的平均值,叫做这组数据的方差之差的平方的平均值,叫做这组数据的方差(fn ch)(fn ch),记做,记做 s2.s2.即即 计算计算(j sun)方差的步骤可概括为方差的步骤可概括为:“先平均,后求差,平方后,再平均先平均,后求差,平方后,再平均”.第26页/共33页第二十七页,共33页。刘亮和李飞参加射击训练的成绩刘亮和李飞参加射击训练的成绩(单位单位(dnwi)(dnwi):环:环)如下:如下:刘亮:刘亮:7,8,8,9,7,8,8,9,7,9;李飞:李飞:6,8,7,7,8,9,10,7,9,9.(1 1)两人的平均
25、成绩两人的平均成绩(chngj)(chngj)分别是多少?分别是多少?(2 2)计算计算(j sun)(j sun)这两组数据的方差?这两组数据的方差?(3)谁的成绩比较稳定谁的成绩比较稳定?第27页/共33页第二十八页,共33页。刘亮、李飞的射击成绩刘亮、李飞的射击成绩(chngj)(chngj)的方差分别的方差分别是是 计算结果表明:计算结果表明:s2 s2李飞李飞 s2 s2刘亮,这说明刘亮,这说明(shumng)(shumng)李李飞的射击成绩波动大,而刘亮的射击成绩波动小,因此刘亮飞的射击成绩波动大,而刘亮的射击成绩波动小,因此刘亮的射击成绩稳定的射击成绩稳定.第28页/共33页第二
26、十九页,共33页。一般地,一组数据一般地,一组数据(shj)(shj)的方差越小,说的方差越小,说明这组数据明这组数据(shj)(shj)离散或波动的程度就越小,离散或波动的程度就越小,这组数据这组数据(shj)(shj)也就越稳定也就越稳定.第29页/共33页第三十页,共33页。1、已知一组数据为、已知一组数据为2、0、-1、3、-4,则这组数据的,则这组数据的方差为方差为 2、甲、乙两名学生在相同的条件下各射靶、甲、乙两名学生在相同的条件下各射靶10次,命中次,命中的环数如下:甲:的环数如下:甲:7、8、6、8、6、5、9、10、7、4 乙:乙:9、5、7、8、7、6、8、6、7、7经过计
27、算,两人射击环数的平均数相同,但经过计算,两人射击环数的平均数相同,但 S S ,所以确定去参加,所以确定去参加(cnji)比赛。比赛。练习题三练习题三S2=6乙乙第30页/共33页第三十一页,共33页。3.甲、乙两台机床生产同种零件,甲、乙两台机床生产同种零件,10天出的次天出的次品分别是品分别是甲:甲:0、1、0、2、2、0、3、1、2、4乙:乙:2、3、1、2、0、2、1、1、2、1分别计算出两个样本分别计算出两个样本(yngbn)的平均数和方的平均数和方差,差,根据你的计算判断哪台机床的性能较好?根据你的计算判断哪台机床的性能较好?第31页/共33页第三十二页,共33页。4.从甲、乙两种农作物中各抽取从甲、乙两种农作物中各抽取10株苗,分别株苗,分别(fnbi)测得它的苗高如下:(单位:测得它的苗高如下:(单位:cm)甲:甲:9、10、11、12、7、13、10、8、12、8;乙:乙:8、13、12、11、10、12、7、7、9、11;问:(问:(1)哪种农作物的苗长的比较高?)哪种农作物的苗长的比较高?(2)哪种农作物的苗长得比较整齐?)哪种农作物的苗长得比较整齐?第32页/共33页第三十三页,共33页。
限制150内