第九章资单变量分析精选文档.ppt
《第九章资单变量分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第九章资单变量分析精选文档.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章资单变量分析本讲稿第一页,共五十八页第一节单变量描述w1,频数与频率分布w频数分布:一组数据取不同值的个案的次数分布情况p196w频率分布:一组数据中不同取值的频数相对总数的比率分布情况。本讲稿第二页,共五十八页w例子wP197w工人420%w干部630%w教师315%w商人525%w农民210%w合计20100%本讲稿第三页,共五十八页w例子:年龄分布:20,19,18,19,18,20,21,17,18,18,19,19,20,19,19,17,18,20,19,19,21,21,19,20,19本讲稿第四页,共五十八页w2,集中趋势w平均数w简单平均w频数平均:p198w分组平均:
2、x=(上限+下限)/2本讲稿第五页,共五十八页w众数:频数最大的数w中位数:大小排列后的中间数(n+1)/2w奇数个单位时:中间的数w偶数个单位时:中间两个数的和的一半。w分组时:P201本讲稿第六页,共五十八页w问题:w平均数能否反映实际的情况?w那一个数比较真实反映实际情况?w今年统计全国80%的员工工资在平均数以下。本讲稿第七页,共五十八页w3,离散趋势w用一特别数值表示的数据之间的离散程度。w如考试分数w中文系78,79,80,81,82w数学系65,72,80,88,95w英语系35,78,89,98,100w平均数都是80本讲稿第八页,共五十八页w1,全距,也叫极差w中文系82-7
3、8=4w数学系95-65=30w英语系100-35=65w缺点:受两极影响大,有时不具实际意义w2,标准差本讲稿第九页,共五十八页w中文系1.41,数学系10.8,英语系23.8w所以中文系的成绩最具代表性。w3,异众化率wVR=(n-fmo)/nn为非众数次数,fmo为众数次数w4,四分位差w去掉前后各1/4,中间两组数据的差本讲稿第十页,共五十八页w例子w11人年龄:17,18,18,19,19,19,20,20,21,21,22,22,求四分位差w前1/4位置:(n+1)/4=3,为第三个数:18w后1/4位置:3(n+1)/4=9,为第九个数:21w全距=21-18=3本讲稿第十一页,
4、共五十八页w5,离散系数:coefficientOfvariationw标准差与平均值的比。wCV=S/Xmeanw用于比较差异的大小。P205,例子8.本讲稿第十二页,共五十八页第二节统计分组w统计分组的意义统计分组的意义w根据统计研究任务的要求和现象的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几部分,称为统计分组。统计分组可以按分组的任务和作用、分组标志的多少以及分组标志的性质等方面进行分类。w统计分组的种类统计分组的种类w统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。进行这些分组的目的,分别是划分社会经济类型、研究同类总体的结构和分析被研究总体诸标志之间
5、的联系和依存关系。w例如我国1994年和1995年国内生产总值按三次产业来分组:本讲稿第十三页,共五十八页本讲稿第十四页,共五十八页本讲稿第十五页,共五十八页w现在举例说明变量数列编制的过程。例如根据抽样调查,1995年某城镇50户居民家庭平均每人每月生活费收入的资料如下:w322294273237398327298276246311w240275296324382229264288235271w291319360226262286309352337222260w284304343217259283303200253281301w329212257281303332本讲稿第十六页,共五十八页w
6、将这些数字从小到大排列起来:w200212217222226229235237240246253257259260262264271273275276281281281283284286288291294296298301303304309311319322324327329332337343352355360367382398w计算全距。398-200=198本讲稿第十七页,共五十八页w根据这50户居民家庭人均月生活费收入序列化后所呈现出一定规律性的认识,参照上面所说一系列分组方法的原理,我们假定把变动全距分为8个相等的组距,则组距为198/8=24.75元,化整为25元。这里第一组的下限应
7、为200元,于是上下限化整为200225元,225250元。分组情况见下表:本讲稿第十八页,共五十八页本讲稿第十九页,共五十八页本讲稿第二十页,共五十八页w分组的频数与频率分组的频数与频率w变量数列中各组单位数表示我们所要考察的标志值在各组中出现的次数,所以称为次数或频数。各组次数占总次数的比重称为频率。频数与频率作为分配数列的要素有着重要的意义。在变量数列中,标志值构成的数列表示标志值变动幅度,而频数构成的数列中表示相应标志值的作用程度。频数越大则该组的标志值对于全体标志水平所起的作用也就越大,反之,作用越小。因此在整理分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 章资单 变量 分析 精选 文档
限制150内