应用统计之数据的整理与抽样.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用统计之数据的整理与抽样.pptx》由会员分享,可在线阅读,更多相关《应用统计之数据的整理与抽样.pptx(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本资料来源 4、数据的描述性指标 频数分布所给定的是一个分布形状,要进一步描述和刻画其分布的数量特征,则需要计算数据的集中趋势和离散程度。它们是反映数据分布数量规律的一对代表值。 若所描述的数据是所观察研究的总体,则称这些代表值为参数; 若所描述的数据仅是总体中随机抽取的一个样本,则称这些代表值为统计量。 一、集中趋势 集中趋势亦称趋中性。它表示同类现象在一定时间、地点条件下所达到的一般水平与大量单位的综合数量特征。集中趋势有三个特点: 它用一个代表值综合反映总体各单位 (所有个体) 某种标志值的一般水平或代表水平; 它抽象掉了各个个体之间标志值的差异; 它一般用单位的数值表示,其计量单位与标
2、志值的计量单位相一致。 集中趋势的作用: 可方便地比较若干总体的某种标志值的平均水平,说明它们在某一数量标志上的差异。如平均成绩、平均身高等; 可研究总体某种标志值的平均水平随时间的变化,说明其发展趋势和规律。如人均收入的变化、劳动生产率的变化等; 可分析社会经济现象间的依存关系,为此必须采用分组的方法。 4、可作为评价事物优劣的数量标准。如各批产品合格率; 5、可用以计算和估算其他重要经济指标(如由人均收入估算社会购买力)。 统计学上对集中趋势有以下几种主要测度值: 1、均值 均值又称算术平均数。是数据集中趋势的主要测度值。对于未经整理的原始数据,一般用以下公式: 简单算术平均数 如平均工资
3、、平均身高、平均成绩等的计算。niinnxnxxxx121NiiNNXNXXXX121Xx均值观察值容量总体N样本niXix 例:某班级 28 名学生的应用统计学成绩如下: 72 85 64 92 76 73 87 82 96 66 77 65 57 90 71 69 70 74 68 79 60 53 75 88 72 78 61 67 计算该班学生应用统计学的平均成绩。 解:82.7328206728676178648572X 简单算术平均数较准确地描述了总体与个体之间的数量关系,其描述方式同时考虑了变量值的次数和变量值的大小对集中趋势的影响,数列中任何数值和次数的变化都会引起算术平均数的
4、改变,它是最灵敏、对资料运用最充分的指标。 加权算术平均数 当数据是已经分组的频数分布资料时,计算算术平均数需要用加权平均法。“权”即占总次数的比重。近似算法如下: KKKffffXfXfXX212211KiKiiiiKiiKiiiffXffX1111 kkkffffxfxfxx212211kikiiiikiikiiiffxffx1111均值组中值组数总体K样本kiXixXx成绩分组组中值 人数5060552110607065852070807511825809085434090100953285合计282080ifiifX29.7428208011KiiKiiiffXX 在使用组中值 作为第
5、 i 组的代表值时,假设各组数据在组内分布均匀,但实际上并非如此,所以计算的均值会产生误差。 均值不仅受组中值大小的影响,而且也会受权数 的影响,权数 越大,则该组数值对均值的影响就越大。由均值的计算公式很容易看出这一点。iXififKiKiiiiffXX11 月工资 (元) 员工数 (人) 各组平均工资 工资总额 f x xf 1600以下 40 1550 6200016001700 100 1650 16500017001800 200 1750 35000018001900 400 1850 74000019002000 450 1950 87500020002200 250 2100
6、525000 2200以上 60 2300 138000 合 计 1500 2855000 = 2855000/1500 = 1903.33 元算术平均数的特点: 各变量值与其算术平均数的离差之和等于 0,即 各变量值与其算术平均数的离差平方和为最小值 (相对于其他任何数),即01niixx最小值min12niixxiiiffxx 例如,为分析某乡农民家庭生活水平与家庭人口的关系,则需按人均月收入对该乡农户分组。也可按户人口数分组。人均月收入(分组) 调查户数 人口数 户均人口数 250以下 9 54 6.0 250300 9 49 5.4 300350 31 162 5.2 350400 9
7、6 403 4.2 400600 69 239 3.5 600以上 12 35 2.9 合 计 226 942 4.2 2、几何平均数 它是与算术平均数不同的另一种平均数,主要用于环比发展速度或比率均值的计算。 简单几何平均数 这是在资料未分组情况下采用的一种计算方法。其中, 是第 i 期的发展速度或比率。nniinnaaaaG1121ia某企业“九五”期间产品销售额的年增长速度为因 ,所以可用对数计算几何平均数。 年 份 1995 1996 1997 1998 1999 2000增长速度 (%) 27 18 23 16 25相对前一年 (%) 127 118 123 116 125相对199
8、5 (%) 100 127 149.9 184.3 213.8 267.3niinaG1naGnii1lnln%7.121G 加权几何平均数 在资料已经分组,每个变量值出现次数或比重不等时,应使用加权几何平均。即对数计算公式为niiniiiGfxfM11lnlnniinnffffGxxxM12211 假设投资银行某项投资的年利率按复利计算,25年的年利率分配为:有1 年 3 %,有4 年 4 %,有 8 年 8 %,有10 年10 %,有 2 年15 %,求平均年利率。(单利: )25121084115. 110. 108. 104. 103. 1G%5 .108%6 .262565. 625
9、1%5 .1082512525GR 3、中位数 将一组变量值按大小顺序排列,位于数列中间位置的变量值即为中位数。由于中位数居于数列正中,所以它可以作为代表一般水平和集中趋势的代表值。在标志变异度较大的情况下,可避免极端数值 (不稳健) 的影响。 单项变量数数列 中位数为 为中位数的位置。21NXX21N 例:某班级 28 名学生的应用统计学成绩如下: 72 85 64 92 76 73 87 82 96 66 77 65 57 90 71 69 70 74 68 79 60 53 75 88 72 78 61 67 计算该班学生应用统计学成绩的中位数。 解:N = 28,Me= (N+1)/2
10、 = (28+1)/2 = 14.5 对成绩顺序排列后,X14 = 72, X15 = 73 5 .722737221514XXX 组距变量数列 确定中位数所在组 计算公式为 N/2 或 ,N 和 为总次数; 计算中位数 下限公式含有中位组均匀分布的假设。2ffdfSfLXemm12其中,L 中位数所在组的下组限; 数值在 L 之下各组的累计次数; 中位数所在组的次数; d 中位数所在组的组距。上限公式1mSemfdfSfUXemm12 例:成绩分组组中值 人数5060552110607065852070807511825809085434090100953285合计282080ifiifX
11、解:N = 28,L = 70,Sm-1 = 10, = 11,d = 10显然,64.731011101470emfdfSfLXemm12 例: 年收入额 (元) 农户数 百分比 (%) 26002800 240 8 28003000 480 16 30003200 1050 35 32003400 600 20 34003600 270 9 36003800 210 7 38004000 120 4 42004400 30 1 合 计 3000 100 解:N = 3000,L = 3000,Sm-1 = 720, = 1050,d = 200显然,6 .31482001050720150
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 数据 整理 抽样
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内