欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    教育统计学第四章.ppt

    • 资源ID:88500189       资源大小:1.62MB        全文页数:41页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    教育统计学第四章.ppt

    LOGO第第四四章章 差异差异量量第一节第一节 全距、四分位距、百分位距全距、四分位距、百分位距第二节第二节 平均差平均差第三节第三节 方差和标准差方差和标准差第第四四节节 相对差异量相对差异量第五节第五节 偏态量及峰态量偏态量及峰态量引引 言言两组学生某科测验成绩:两组学生某科测验成绩:甲组:甲组:54、63、72、74、82、88、99乙组:乙组:67、71、73、76、79、82、84 表示一组数据变异程度或离散程度的量称为差异量。差表示一组数据变异程度或离散程度的量称为差异量。差异量越大,表示数据分布的范围越广,越不整齐;差异量越异量越大,表示数据分布的范围越广,越不整齐;差异量越小,表示数据分布的越集中,变动范围越小。常用的差异量小,表示数据分布的越集中,变动范围越小。常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差、指标有全距、四分位距、百分位距、平均差、方差、标准差、差异系数等。差异系数等。差异量数就是对一组数据的变异性(离中趋差异量数就是对一组数据的变异性(离中趋势)特点进行度量和描述的统计量。它反映了次势)特点进行度量和描述的统计量。它反映了次数分布中数据彼此分散的程度。数分布中数据彼此分散的程度。第一节第一节 全距、四分位距、百分位距全距、四分位距、百分位距一、全距一、全距 全距是一组数据中最大值与最小值之差,又称极差。全距是一组数据中最大值与最小值之差,又称极差。用用R表示。表示。如上例:两组学生某科测验成绩:如上例:两组学生某科测验成绩:甲组:甲组:54、63、72、74、82、88、99乙组:乙组:67、71、73、76、79、82、84甲组的全距为甲组的全距为R=99-54=45乙组的全距为乙组的全距为R=84-67=17说明甲组比乙组的离散程度大。说明甲组比乙组的离散程度大。频数分布表求全距的方法是:最大一组与最小一组组中频数分布表求全距的方法是:最大一组与最小一组组中值之差。值之差。全距的应用及优缺点全距的应用及优缺点 概念清楚、意义明确,计算简单,但易受两概念清楚、意义明确,计算简单,但易受两极端数据的影响。不考虑中间值的差异,反应不极端数据的影响。不考虑中间值的差异,反应不灵敏。灵敏。只能作为差异量的粗略指标,在编制频数分只能作为差异量的粗略指标,在编制频数分布表时常用到。布表时常用到。二、四分位距二、四分位距1.四分位距的概念四分位距的概念 四分位距是指在一个四分位距是指在一个频频数分布中,中间数分布中,中间50%的的频频数数的全距之半,也就是第的全距之半,也就是第3四分位数四分位数Q3(第(第75百分位数)百分位数)与第与第1四分位数四分位数Q1(第(第25百分位数)百分位数)之差的一半。所谓之差的一半。所谓第第3四分位数是指在这一点的下端有占总四分位数是指在这一点的下端有占总频频数数75%的数据,的数据,在其上端有占总在其上端有占总频频数数25%的数据;所谓第的数据;所谓第1四分位数中指四分位数中指在这一点的下端有占总在这一点的下端有占总频频数数25%的数据,在其上端有占的数据,在其上端有占总总频频数数75%的数据。如图的数据。如图4-1。图图4-1 四分差与四分位数四分差与四分位数Q1、Q2、Q3之间的关系之间的关系用公式可表示为用公式可表示为 2.四分位距的计算方法四分位距的计算方法 (1)原始数据计算法)原始数据计算法首先将一组数据按大小顺序排列,然后用数据个数首先将一组数据按大小顺序排列,然后用数据个数n除以除以4,则第(,则第(n/4+1/2)位置对应的数据为第)位置对应的数据为第1四分位数四分位数Q1,第(,第(3n/4+1/2)位置对应的数据为第)位置对应的数据为第3四分位数四分位数Q3。例例6 求下列求下列18个数据的四分差:个数据的四分差:51,60,58,63,74,88,66,70,71,75,81,86,52,57,61,65,90,77。解:按从小到大排序:解:按从小到大排序:51,52,57,58,60,61,63,65,66,70,71,74,75,77,81,86,88,90。由于由于n=18,所以,所以Q1=18/4+1/2=5,即第,即第5个位个位置所对应的数据为置所对应的数据为60;Q3=18*3/4+1/2=14,即第即第14个位置所对应的数据为个位置所对应的数据为77。将将Q1与与Q3代入公式代入公式,得得QD=(77-60)/2=8.5 (2)频数分布表计算法)频数分布表计算法(第三个四分位数)(第三个四分位数)(第一个四分位数)(第一个四分位数)例如下表为师大附小二年级例如下表为师大附小二年级80个学生身高的频数个学生身高的频数分布,求四分位距。分布,求四分位距。表表2.10 师大附小二年级师大附小二年级80个学生身高的频数分布个学生身高的频数分布3.四分位距的应用及优缺点四分位距的应用及优缺点l优点:简明易懂,计算简便,不易受两极端数据的影响优点:简明易懂,计算简便,不易受两极端数据的影响l缺点:忽略了左右缺点:忽略了左右50%数据的差异,不适合代数运算数据的差异,不适合代数运算 当一组数据用中位数表示集中量时,就要用四分位当一组数据用中位数表示集中量时,就要用四分位数表示差异量,因为它们同属于百分体系。数表示差异量,因为它们同属于百分体系。l应用条件:有特大或特小两极端数值;应用条件:有特大或特小两极端数值;有个别数值不确切、不清楚;有个别数值不确切、不清楚;用等级表示的数据用等级表示的数据三、百分位距三、百分位距 百分位距是指两个百分位数之差。常用的百百分位距是指两个百分位数之差。常用的百分位距有两种:分位距有两种:l第第90与第与第10百分位数之差百分位数之差 l第第93与第与第7百分位数之差百分位数之差 例如,求下表中例如,求下表中 与与 。表表2.10 师大附小二年级师大附小二年级80个学生身高的频数分布个学生身高的频数分布回忆百分位数计算方法回忆百分位数计算方法第二节第二节 平均差平均差一、平均差的概念一、平均差的概念 每一个数据与该组数据中位数离差的绝对值的算术每一个数据与该组数据中位数离差的绝对值的算术平均数即为该组数据的平均差,用平均数即为该组数据的平均差,用MD表示。表示。二、平均差的计算方法二、平均差的计算方法 1.原始数据计算法原始数据计算法原始数据原始数据中位数中位数总频数总频数 例如,求原始数据例如,求原始数据78、83、69、75、97、88、86的的平均差。平均差。2.频数分布表计算法频数分布表计算法各组频数各组频数各组组中值各组组中值总频数总频数表表3-2 48个学生数学成绩频个学生数学成绩频数分布表数分布表三、平均差的优缺点三、平均差的优缺点l优点:意义明确,计算简单,每个数据都参加了运算,优点:意义明确,计算简单,每个数据都参加了运算,考虑到了全部的离差,反应灵敏考虑到了全部的离差,反应灵敏l缺点:计算用到绝对值,不适合代数运算,因此在统计缺点:计算用到绝对值,不适合代数运算,因此在统计分析中应用较少。分析中应用较少。第三节第三节 方差和标准差方差和标准差一、方差和标准差的概念一、方差和标准差的概念 方差是指离差平方的算术平均数,用方差是指离差平方的算术平均数,用 表示,公表示,公式为:式为:标准差是指方差的平方根,用标准差是指方差的平方根,用 表示,即:表示,即:例如:例如:6名女童的跳远成绩(名女童的跳远成绩(cm)148.2、123.8、123.8、142.7、130.4、133.3,求方差和标准差。,求方差和标准差。标准差的值越大,表明这组数据的离散程度标准差的值越大,表明这组数据的离散程度越大,即数据越参差不齐,分布范围越广;标准越大,即数据越参差不齐,分布范围越广;标准差的值越小,表明这组数据的离散程度越小,即差的值越小,表明这组数据的离散程度越小,即数据越集中、整齐,分布范围越小。在教育科研数据越集中、整齐,分布范围越小。在教育科研中,究竟是标准差大好还是小好,这要看所分析中,究竟是标准差大好还是小好,这要看所分析的问题而异。的问题而异。二、二、方差和方差和标准差的计算方法标准差的计算方法 1.原始数据原始数据法法 为了减少计算量,可将公式为了减少计算量,可将公式4.1进行转换,使公式中参进行转换,使公式中参与运算的变量皆为原始数据。公式为与运算的变量皆为原始数据。公式为原始数据原始数据总频数总频数 2.频数分布表计算法频数分布表计算法 各组组中值各组组中值各组频数各组频数例如:例如:表表3-2 48个学生数学成绩频个学生数学成绩频数分布表数分布表三三、方差和方差和标准差的标准差的应用及优缺点应用及优缺点l优点:反应灵敏;严密确定;计算简单;适合代数运算;优点:反应灵敏;严密确定;计算简单;适合代数运算;用样本数据推断总体差异量时,是最好的估计量;用样本数据推断总体差异量时,是最好的估计量;在避免两极端数值影响方面大大超过全距;在避免两极端数值影响方面大大超过全距;在考虑到全部离差方面,优于四分位距;在考虑到全部离差方面,优于四分位距;在避免绝对值方面,优于平均差。在避免绝对值方面,优于平均差。l缺点:不易理解;缺点:不易理解;易受极端数值影响;易受极端数值影响;有个别数据模糊不清时,无法计算。有个别数据模糊不清时,无法计算。l适用条件适用条件1、一组数据的一般水平适合用算术平均数描、一组数据的一般水平适合用算术平均数描述时,其离散程度宜用述时,其离散程度宜用方差和标准方差和标准差描述。差描述。2、计算其它统计量时,如相关系数等,要用、计算其它统计量时,如相关系数等,要用到标准差。到标准差。3、在推断统计中,尤其是进行方差分析时,、在推断统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。常用方差表示数据的离散程度。四、各种差异量的数值关系四、各种差异量的数值关系当总频数相当大,且频数分布呈正态时,全距、四分位距、当总频数相当大,且频数分布呈正态时,全距、四分位距、平均差、标准差的数值存在如下关系:平均差、标准差的数值存在如下关系:中位数上下各一个四分位距之间包括中位数上下各一个四分位距之间包括50%的总频数;的总频数;算数平均数上下各一个平均差之间包括算数平均数上下各一个平均差之间包括57.51%的总频数;的总频数;算数平均数上下各一个标准差之间包括算数平均数上下各一个标准差之间包括68.26%的总频数;的总频数;第四节第四节 差异系数差异系数一、差异系数的概念一、差异系数的概念 差异系数是一组数据的标准差与差异系数是一组数据的标准差与算数算数平均数平均数的比率,又称相对的比率,又称相对差异量差异量,它是没有单位的相对它是没有单位的相对数。数。用符号用符号CV表示。公式为表示。公式为 由上式可见,差异系数就是以平均数为单位,视标由上式可见,差异系数就是以平均数为单位,视标准差占平均数百分比的大小来衡量差异的程度。差异系准差占平均数百分比的大小来衡量差异的程度。差异系数越大,表明离散程度越大;差异系数越小,表明离散数越大,表明离散程度越大;差异系数越小,表明离散程度越小。程度越小。二、差异系数的用途二、差异系数的用途1.比较不同单位资料的差异程度比较不同单位资料的差异程度例如:例如:1975年上海市区年上海市区6岁男童体重与身高为:岁男童体重与身高为:其差异系数为:其差异系数为:体重体重身高身高可见,体重的差异大于身高的差异。可见,体重的差异大于身高的差异。2.比较单位相同而平均数相差较大的两组资料的差比较单位相同而平均数相差较大的两组资料的差异程度异程度例如:例如:1975年上海市区两组女童的体重为:年上海市区两组女童的体重为:2个月个月组组6岁组岁组可见,两组女童体重的离散程度大体相同。可见,两组女童体重的离散程度大体相同。3.可判断特殊差异情况可判断特殊差异情况 根据经验,一般根据经验,一般CV值常在值常在5%35%之间。之间。如果如果CV35%时,可怀疑所求得的平均数是否失去了意义;时,可怀疑所求得的平均数是否失去了意义;如果如果CV0,分布为正偏态;,分布为正偏态;SK200时,所计算出的偏态系数才比较可靠。时,所计算出的偏态系数才比较可靠。例如课本表例如课本表4.4,4.5 二、峰态量二、峰态量 1.用两个百分位距来计算用两个百分位距来计算 一个频数分布,若平均数周围频数比例越大,分布形态一个频数分布,若平均数周围频数比例越大,分布形态越高狭;若平均数周围频数比例越小,分布形态越低阔;越高狭;若平均数周围频数比例越小,分布形态越低阔;常用的峰态量为:常用的峰态量为:当当 时,表明频数分布呈正态峰;时,表明频数分布呈正态峰;当当 时,表明频数分布呈高狭峰;时,表明频数分布呈高狭峰;当当 时,表明频数分布呈低阔峰;时,表明频数分布呈低阔峰;例如课本表例如课本表4.12.根据动差来计算根据动差来计算峰态系数为:峰态系数为:当当 时,表明频数分布呈正态峰;时,表明频数分布呈正态峰;当当 时,表明频数分布呈高狭峰;时,表明频数分布呈高狭峰;当当 时,表明频数分布呈低阔峰;时,表明频数分布呈低阔峰;n1000时,计算的峰态系数才比较可靠。时,计算的峰态系数才比较可靠。例子:课本表例子:课本表4.4,4.5

    注意事项

    本文(教育统计学第四章.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开