第二章单变量的统计描述分析(3)社会统计学.ppt
《第二章单变量的统计描述分析(3)社会统计学.ppt》由会员分享,可在线阅读,更多相关《第二章单变量的统计描述分析(3)社会统计学.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 单变量统计描述单变量统计描述(3)(3)众值、中位值和均值都反映了资料的集中特征b但这还不够,试比较以下三组数据:b甲组:80 86 90 94 100 X=90b乙组:88 89 90 91 92 X=90b丙组:90 90 90 90 90 X=90 所谓离散趋势测量法所谓离散趋势测量法b是是指指求求出出一一个个值值来来表表示示一一个个变变项项中中各各变变量量值值之之间间的的差距和离散程度。差距和离散程度。b离散趋势反应的是变量分布的分散程度,数据离散趋势反应的是变量分布的分散程度,数据分布的另一个重要特征分布的另一个重要特征b反映各变量值远离其中心值的程度,有时又称反映各变
2、量值远离其中心值的程度,有时又称离中趋势,离势小,平均数的代表性高;离势离中趋势,离势小,平均数的代表性高;离势大,平均数代表性低。大,平均数代表性低。b从另一个侧面说明了集中趋势测度值的代表程从另一个侧面说明了集中趋势测度值的代表程度度b不同类型的集中趋势对应着不同的离散趋势的不同类型的集中趋势对应着不同的离散趋势的测量测量45离散趋势的测量的内容 一一.异众比率异众比率 二二.极差极差 三三.四分位差四分位差 四四.平均差平均差 五五.方差及标准差方差及标准差 六六.离散系数离散系数一、异众比率一、异众比率(Variation Ration)适适用于定类或以上测量层次的变量用于定类或以上测
3、量层次的变量b 异众比率(V)就是非众值的频数占全部个案数目的比率。b公式如下:V=b bN为全部个案数目,fmo是众值的频次。b 这个公式所求出的是在全部的个案中有多少是偏离众值,显然,非众值的比例越小,众值的代表性越好。可见,离异比率是众值的补充可见,离异比率是众值的补充。b当当V=0,说说明明变变量量只只有有一一个个取取值值,那那是是众众值值,这这时时众众值值可可以以完完全全代代表表变变量量;V1时时,表表示示资资料料十十分分分分散散,众众值值几几乎没有代表性。乎没有代表性。例:调查了200名大学生,内心的苦恼倾诉对象意愿为:b党团组织41人、家长49人、知心朋友52人、闷在心里32人、
4、班团干部15人、随便议论11人b可见N=200 fmo=52b V=b 众数的代表性很低b注意:众值与众值频数,即MO与fmo的区别。二、极差(全距)b定义:一组数据的最大值与最小值之差b例如:数据72,81,86,69,和57的极差为:86与57之差等于29。如果数据已被分组,则极差取为极端类别的中点之差例:例:青年人阅读小说书的数目青年人阅读小说书的数目 则极端类别的中点为3和18 极差R=18-3=15 优点:b计算简单,并且一目了然,特别是对外行来说,极差是唯一可理解的离差量度。缺点:b它它仅仅仅仅以以两两个个个个案案为为依依据据,而而且且是是两两个个极极端端的的个个案案,数数据据利利
5、用用率率低低,信信息息丧丧失失严严重重。另另外外,极极差差随随着着样样本本的的变变化化而而变变化化很很大大,一一般般来来说说大大样样本的极差比小样本更大一些本的极差比小样本更大一些。13三、四分位差,检验中位数代表性高低三、四分位差,检验中位数代表性高低 1.排序后处于排序后处于25%和和75%位置上的值位置上的值2.不受极端值的影响不受极端值的影响3.主主要要用用于于定定序序数数据据,也也可可用用于于数数值值型数据,但不能用于定类数据型数据,但不能用于定类数据QQ2525QQ5050QQ757525%25%25%25%b 计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%
6、的个案;则第一个四分位置的值(Q1)与第三个四分位置的(Q3)的差异,就是四分位差(简写Q),公式是Q=Q1-Q3)b 25%25%25%25%b 低 Q1 Q2 Q3 高(一)未分组数据b首先应求出Q1与Q3的位置,公式是:bQ1位置=;bQ3位置=3(N+1)/4b 其中N是全部个案数目 如调查甲、乙两个生产队家庭的人数b甲队有11户人家,每户人数如下:b 2 2 3 4 6 9 10 10 11 13 15b Md位置=Md=9b Q1位置=Q1=3b b Q3位置=Q3=11b 所以四分位差Q=Q3-Q1=11-3=8乙队有8户人家,每户人数如下:b 2,3,4,7,9,10,12,1
7、2bMd位置=bMd=b Q1位置=Q1=3+0.25(4-3)=3.25因此bQ3位置=3(8+1)/4=6.75bQ3=10+0.75(12-10)=11.5 b所以Q=Q3-Q1=11.5-3.25=8.25根据频次分布或四分位差步骤如下:bQ1位置=(N+1)/4=(80+1)/4=20.5 Q1=丁b Q3位置=3(N+1)/4=3(80+1)/4=60.75 Q3=乙bMd位置=1/2(N+1)=1/2(80+1)=40.5 Md=丙b 四分位置Q=Q3-Q1=乙-丁b 结论,有50%的学生成绩在乙与丁之间。21定序数据的四分位数:例【例例例例3.103.10】根根据据第第二二章章
8、表表2-22-2中中的的数数据据,计计算算甲甲城城市市家家庭庭对对住住房房满意状况评价的四分位数满意状况评价的四分位数解:解:解:解:下四分位数下四分位数(Q Q2525)的位置为:的位置为:Q Q2525位置位置(300)/4(300)/47575 上四分位数上四分位数(Q Q7575)的位置为:的位置为:Q Q7575位置位置(3300)/4(3300)/4225225从从累累计计频频数数看看,Q Q2525在在“不不满满意意”这这一一组组别别中中;Q Q7575在在“一一般般”这这一一组别中。因此组别中。因此 Q Q2525 不满意不满意不满意不满意 Q Q7575 一般一般一般一般表2
9、-2 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300根据分组资料求四分位差b步骤:第一步:计算累加次数(Cf)b 第二步:求出Q1和Q3位置b Q1位置=N+1/4 Q3位置=3(N+1)/4 其 中N是全部个案数目b 第三步:参考累加次数分布,决定Q1和Q3的位置应属于哪一组b 第四步:从所属的组中,计算Q1位置和Q3位置的数值 公式如下:bQ1=L1+()W1bQ3=L3+()W3其中:bL1=Q1属组之真实下限bL3=Q3属组之真实下限bf1=Q1属组之频数 f3=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 变量 统计 描述 分析 社会 统计学
限制150内