欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    用样本数字特征估计总体的数字特征.pptx

    • 资源ID:74453047       资源大小:338.84KB        全文页数:32页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    用样本数字特征估计总体的数字特征.pptx

    会计学1用样本数字特征估计总体的数字特征用样本数字特征估计总体的数字特征2n n众数、中位数、平均数众数、中位数、平均数第1页/共32页3一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按大小依次排列,把处:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数 众数众数:在一组数据中,出现次数最多的数:在一组数据中,出现次数最多的数据叫做这组数据的众数据叫做这组数据的众数 众数、中位数、平均数都是描述一组数据众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛其中以平均数的应用最为广泛.平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=第2页/共32页4 练习练习:在一次中学生田径运动会上,参加在一次中学生田径运动会上,参加男子跳高的男子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示:成绩成绩(单位单位:米米)150160165170175180185190人数人数23234111 分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间是最中间的一个数据,即这组数据的中位数是的一个数据,即这组数据的中位数是1.70;第3页/共32页5这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).第4页/共32页6频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)例如,在上一节调查的例如,在上一节调查的100位居民的月均用水量的位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是出,月均用水量的众数是2.25t.如图所示:如图所示:二二、众数、中位数、平均数与众数、中位数、平均数与频率分布直方图的关系频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。第5页/共32页7 2、在样本中,有、在样本中,有50的个体小于或等于中的个体小于或等于中位数,也有位数,也有50的个体大于或等于中位数,因的个体大于或等于中位数,因此,在频率分布直方图中,此,在频率分布直方图中,中位数左边和右边中位数左边和右边的直方图的面积应该相等,的直方图的面积应该相等,由此可以估计中位由此可以估计中位数的值。下图中虚线代表居民月均用水量的中数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为位数的估计值,此数据值为2.03t.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第6页/共32页8说明说明:2.03这个中位数的估计值这个中位数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致.第7页/共32页9 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.n 个样本数据的平均数个样本数据的平均数由公式由公式:给出给出X=下图显示了居民月均用下图显示了居民月均用水量的平均数水量的平均数:x=1.973频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第8页/共32页10三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.第9页/共32页11 2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。第10页/共32页12 3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。第11页/共32页13 四四 众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200250220200100人数人数16510123合计合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?的工资水平吗?为什么?解解:众数为众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出的数据可见,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。故用平均数不能客观真实地反映该工厂的工资水平。第12页/共32页14n标准差标准差第13页/共32页15平均数向我们提供了样本数据的重要信息平均数向我们提供了样本数据的重要信息,但是平均但是平均有时也会使我们作出对总体的片面判断因为这个平有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的不能忽的因此,只有平均数还难以概括样本数据的实际状态实际状态如:有两位射击运动员在一次射击测试中各射靶如:有两位射击运动员在一次射击测试中各射靶10次,每次,每次命中的环数如下:次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有什么那么两个人的水平就没有什么差异吗差异吗?第14页/共32页16(甲)45678910环数频率0.10.20.3频率(乙)456789100.10.20.30.4环数 直观上看直观上看,还是有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散,乙成绩相对集中乙成绩相对集中(如上图所示如上图所示).因此因此,我们还需要从另外的角度来考察这两组我们还需要从另外的角度来考察这两组数据数据.例如例如:在作统计图表时提到过的极差在作统计图表时提到过的极差.第15页/共32页17 甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一与平均数一起起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非极差对极端值非常敏感常敏感,注意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去去掉一个最低分掉一个最低分”的统计策略的统计策略.考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:第16页/共32页18 由于上式含有绝对值,运算不太方便,因此,通常改用由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差如下公式来计算标准差一个样本中的个体与平均数之间的距离关系可用下图表示一个样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为考虑一个容量为2的样本的样本:第17页/共32页19 显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越大数据的离散程度越大;标准标准差越小差越小,数据的离散程度越小数据的离散程度越小.用计算器可算出甲用计算器可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成乙的成绩离散程度小绩离散程度小.由此可以估计由此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定.上面两组数据的离散程度与标准差之间的关系可用图直上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来观地表示出来.45678910a第18页/共32页20标准差标准差 标准差是样本数据到平均数的一种平均距离。标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差常被理解为稳定性。规律:标准差越大,规律:标准差越大,则则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程度越小。度越小。第19页/共32页21例题例题1:画出下列四组样本数据的直方图画出下列四组样本数据的直方图,说明它们的异同点说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解解:四组样本数据的直方图是四组样本数据的直方图是:频率o123456780.10.20.30.40.50.60.70.80.91.0S=0.00(1)第20页/共32页2212345678频率o0.10.20.30.40.50.60.70.80.91.0S=1.490.20.30.40.50.60.70.80.91.0(2)频率o12345678S=0.82频率o123456780.10.20.30.40.50.60.70.80.91.0S=2.83第21页/共32页23四组数据的平均数都是四组数据的平均数都是5.0,标准差分别是标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数虽然它们有相同的平均数,但是它们有不同的标准差但是它们有不同的标准差,说明数据的说明数据的分散程度是不一样的分散程度是不一样的.标准差还可以用于对样本数据的另外一种解释标准差还可以用于对样本数据的另外一种解释.例如例如:在关于居民月均用水量的例子中在关于居民月均用水量的例子中,平均数平均数 标准差标准差s=0.868 所以所以第22页/共32页24例例2 2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm25.40mm的一种零件的一种零件.为了为了对两人的生产质量进行评比对两人的生产质量进行评比,从他们生产的零件中各抽出从他们生产的零件中各抽出2020件件,量得其内径尺寸如下量得其内径尺寸如下(单位单位:mm):mm)甲甲 25.46,25.32,25.45,25.39,25.36 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.40,25.42,25.35,25.41,25.39乙乙 25.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48 从生产的零件内径的尺寸看从生产的零件内径的尺寸看,谁生产的质量较高谁生产的质量较高?第23页/共32页25分析分析:每一个工人生产的所有零件的内径尺寸组成一个总体每一个工人生产的所有零件的内径尺寸组成一个总体,由于零件的生产标准已经给出由于零件的生产标准已经给出(内径内径25.40mm),25.40mm),生产质量可以从生产质量可以从总体的平均数与标准差两个角度来衡量总体的平均数与标准差两个角度来衡量.总体的平均数与内径总体的平均数与内径标准尺寸标准尺寸25.00mm25.00mm的差异在时质量低的差异在时质量低,差异小时质量高差异小时质量高;当总体当总体的平均数与标准尺寸很接近时的平均数与标准尺寸很接近时,总体的标准差小的时候质量高总体的标准差小的时候质量高,标准差大的时候质量低标准差大的时候质量低.这样比较两人的生产质量只要比较他这样比较两人的生产质量只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可的大小即可.但是这两个总体的平均数与标准差都是不知道的但是这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想根据用样本估计总体的思想,我们可以通过抽样分别获得相应我们可以通过抽样分别获得相应的样体数据的样体数据,然后比较这两个样本的平均数然后比较这两个样本的平均数,标准差标准差,以此作为以此作为两个总体之间的估计值两个总体之间的估计值.解解:用计算器计算可得用计算器计算可得:第24页/共32页26 从样本平均数看从样本平均数看,甲生产的零件内径比乙生产的更接近内径甲生产的零件内径比乙生产的更接近内径标准标准(25.40mm),(25.40mm),但是差异很小但是差异很小;从样本标准差看从样本标准差看,由于由于 从上述例子我们可以看到从上述例子我们可以看到,对一名工人生产的零件内径对一名工人生产的零件内径(总体总体)的质量判断的质量判断,与我们抽取的内径与我们抽取的内径(样本数据样本数据)直接相关直接相关.显显然然,我们可以从这名工人生产的零件中获取许多样本我们可以从这名工人生产的零件中获取许多样本(为什么为什么?).?).这样这样,尽管总体是同一个尽管总体是同一个,但由于样本不同但由于样本不同,相应的样本频率相应的样本频率分布与平均数分布与平均数,标准差等都会发生改变标准差等都会发生改变,这就会影响到我们对总这就会影响到我们对总体情况的估计体情况的估计.如果样本的的代表性差如果样本的的代表性差,那么对总体所作出的估那么对总体所作出的估计就会产生偏差计就会产生偏差;样本没有代表性时样本没有代表性时,对总体作出错误估计的可对总体作出错误估计的可能性就非常大能性就非常大.这也正是我们在前面讲随机抽样时反复强调样这也正是我们在前面讲随机抽样时反复强调样本代表性的理由本代表性的理由.在实际操作中在实际操作中,为了减少错误的发生为了减少错误的发生,条件许条件许可时可时,通常采取适当增加样本容量的方法通常采取适当增加样本容量的方法.当然当然,关键还是要改关键还是要改进抽样方法进抽样方法,提高样本的代表性提高样本的代表性.第25页/共32页27小结:小结:小结:小结:1.1.众数、中位数、平均数的众数、中位数、平均数的概念概念2.2.众数、中位数、平均数与频众数、中位数、平均数与频率分布直方图的关系率分布直方图的关系3.3.三种数字特征的优缺点三种数字特征的优缺点4.4.什么是标准差什么是标准差?5.5.如何利用标准差刻画数据如何利用标准差刻画数据的离散程度的离散程度?作业作业:P82练习练习1、2、3第26页/共32页28解解:依题意计算可得依题意计算可得 x1=900 x2=900 s123.8 s2 42.6甲乙两种水稻甲乙两种水稻6年平均产量的平均数相同年平均产量的平均数相同,但但甲的标准差比乙的小甲的标准差比乙的小,所以甲的生产比较稳定所以甲的生产比较稳定.第27页/共32页29解解:(1)平均重量约为平均重量约为496.86 g,标准差约为标准差约为6.55(2)重量位于重量位于(x-s,x+s)之间有之间有14袋白糖袋白糖,所占所占百分比为百分比为66.67%.第28页/共32页30解解:平均数平均数x19.25,中位数为中位数为15.2,标准差标准差s12.50.这些数据表明这些国家男性患该病的平均死亡率约为这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过有一半国家的死亡率不超过15.2,x 15.2 说说明存在大的异常数据明存在大的异常数据,这些异常数据使得标准差增大这些异常数据使得标准差增大.第29页/共32页31生产过程中的质量控制图生产过程中的质量控制图正态分布:一些总体的分布密度曲线是由它的平均正态分布:一些总体的分布密度曲线是由它的平均数数 与标准差与标准差 完全确定的,我们把这样的分布完全确定的,我们把这样的分布记作记作 ,称为平均数为,称为平均数为 ,方差为,方差为 的的正态分布。正态分布。第30页/共32页32生产过程中的质量控制图生产过程中的质量控制图第31页/共32页

    注意事项

    本文(用样本数字特征估计总体的数字特征.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开