用样本数字特征估计总体的数字特征.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《用样本数字特征估计总体的数字特征.pptx》由会员分享,可在线阅读,更多相关《用样本数字特征估计总体的数字特征.pptx(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1用样本数字特征估计总体的数字特征用样本数字特征估计总体的数字特征2n n众数、中位数、平均数众数、中位数、平均数第1页/共32页3一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,把处:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数 众数众数:在一组数据中,出现次数最多的数:在一组数据中,出现次数最多的数据叫做这组数据的众数据叫做这组数据的众数 众数、中位数、平均数都是描述一组数据众数、中位数、平均数都是描述一组数
2、据的集中趋势的特征数,只是描述的角度不同,的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛其中以平均数的应用最为广泛.平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=第2页/共32页4 练习练习:在一次中学生田径运动会上,参加在一次中学生田径运动会上,参加男子跳高的男子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示:成绩成绩(单位单位:米米)150160165170175180185190人数人数23234111 分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出
3、现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间是最中间的一个数据,即这组数据的中位数是的一个数据,即这组数据的中位数是1.70;第3页/共32页5这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).第4页/共32页6频率频率组距组距0.10.20.30.40.5
4、O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)例如,在上一节调查的例如,在上一节调查的100位居民的月均用水量的位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是出,月均用水量的众数是2.25t.如图所示:如图所示:二二、众数、中位数、平均数与众数、中位数、平均数与频率分布直方图的关系频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。第5页/共32页7 2、在样本中,有、在样本中,有5
5、0的个体小于或等于中的个体小于或等于中位数,也有位数,也有50的个体大于或等于中位数,因的个体大于或等于中位数,因此,在频率分布直方图中,此,在频率分布直方图中,中位数左边和右边中位数左边和右边的直方图的面积应该相等,的直方图的面积应该相等,由此可以估计中位由此可以估计中位数的值。下图中虚线代表居民月均用水量的中数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为位数的估计值,此数据值为2.03t.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第6页/共32页8说明说明:2.03这个中位数的估计值这个中位
6、数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致.第7页/共32页9 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.n 个样本数据的平均数个样本数据的平均数由公式由公式:给出给出X=下图显示了居民月均用下
7、图显示了居民月均用水量的平均数水量的平均数:x=1.973频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第8页/共32页10三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,
8、但它并没有告诉我们多多少但它并没有告诉我们多多少.第9页/共32页11 2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。第10页/共32页12 3、由于平均数与每一个样本的、由于平均数
9、与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。第11页/共32页13 四四 众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例 某工厂人员及工资构
10、成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200250220200100人数人数16510123合计合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?的工资水平吗?为什么?解解:众数为众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出的数据可见,由表格中所列出的
11、数据可见,只有经理在平均数以上,其余的人都在平均数以下,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。故用平均数不能客观真实地反映该工厂的工资水平。第12页/共32页14n标准差标准差第13页/共32页15平均数向我们提供了样本数据的重要信息平均数向我们提供了样本数据的重要信息,但是平均但是平均有时也会使我们作出对总体的片面判断因为这个平有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的不能忽的因此,只有平均数还难以概括
12、样本数据的实际状态实际状态如:有两位射击运动员在一次射击测试中各射靶如:有两位射击运动员在一次射击测试中各射靶10次,每次,每次命中的环数如下:次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有什么那么两个人的水平就没有什么差异吗差异吗?第14页/共32页16(甲)45678910环数频率0.10.20.3频率(乙)456789100.10.20.30.4环数 直观上看直观上看,还是
13、有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散,乙成绩相对集中乙成绩相对集中(如上图所示如上图所示).因此因此,我们还需要从另外的角度来考察这两组我们还需要从另外的角度来考察这两组数据数据.例如例如:在作统计图表时提到过的极差在作统计图表时提到过的极差.第15页/共32页17 甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一与平均数一起起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非极差对极端值非常敏感常敏感,注意到这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 数字 特征 估计 总体
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内