数据的搜集与整理 .ppt
《数据的搜集与整理 .ppt》由会员分享,可在线阅读,更多相关《数据的搜集与整理 .ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、管 理 学 院王雪华副教授第二章、数据的搜集与整理第二章、数据的搜集与整理 统计工作总是从收集资料开始的,但由于统计工作总是从收集资料开始的,但由于生产和实践过程中收集到的资料和数据往生产和实践过程中收集到的资料和数据往往是分散的,而且从表面上看不出有什么往是分散的,而且从表面上看不出有什么规律性,也不能说明任何问题,必须经过规律性,也不能说明任何问题,必须经过整理和归纳后,这一批数据所遵循的规律整理和归纳后,这一批数据所遵循的规律才能显露出来,方可得出有意义的统计结才能显露出来,方可得出有意义的统计结论。论。数据的收集数据的收集数据的整理数据的整理管 理 学 院王雪华副教授数据的收集数据的收
2、集从理论上讲,进行大量观测、试验,从理论上讲,进行大量观测、试验,就可以清楚地掌握随机现象的统计规就可以清楚地掌握随机现象的统计规律。但有时大量试验客观上是不允许律。但有时大量试验客观上是不允许的(如破坏性试验),这时只能得到的(如破坏性试验),这时只能得到有限的,甚至是很少的数据,以什么有限的,甚至是很少的数据,以什么样的方式收集资料更为有效?样的方式收集资料更为有效?抽样抽样管 理 学 院王雪华副教授 例子:例子:国家医护协会对于医护专业未来护士国家医护协会对于医护专业未来护士的缺乏十分关注。为了了解现阶段护士们对于工的缺乏十分关注。为了了解现阶段护士们对于工作的满意程度,该协会发起了一向
3、对全国的医院作的满意程度,该协会发起了一向对全国的医院护士的调查研究。作为研究的一部分,一个由护士的调查研究。作为研究的一部分,一个由50名护士组成的小组被要求写出她们对工作、工资名护士组成的小组被要求写出她们对工作、工资和升职机会的满意程度和升职机会的满意程度(见表一)(见表一)抽样抽样管 理 学 院王雪华副教授几个概念几个概念总体(population):全国的医院护士-研究对象的全体/或研究对象的某项数量指标X的值的全体。一般用X表示。样本(sample):被抽到的这50名护士-总体中抽出若干个体所组成的集合。一般用X1X2Xn表示一个样本容量为n的样本。管 理 学 院王雪华副教授抽样的
4、目的!抽样的目的!1.总体?总体?全体医护人员对全体医护人员对工作的满意度工作的满意度3.这这50 名护士对名护士对工作的满意度工作的满意度资料资料2.样本!样本!被抽到的被抽到的50名名护士护士4.将样本的结论将样本的结论推广到总体上推广到总体上管 理 学 院王雪华副教授抽样抽样抽样调查中应当注意的问题抽样调查中应当注意的问题抽样方法的优点抽样方法的优点抽样方法抽样方法抽样调查的应用抽样调查的应用管 理 学 院王雪华副教授抽样方法的优点抽样方法的优点费用较低费用较低速度较快速度较快应用范围较广应用范围较广准确度较高准确度较高管 理 学 院王雪华副教授费用较低费用较低 如果数据是从总体的一个很
5、小的如果数据是从总体的一个很小的部分取得,那么他的费用就比普部分取得,那么他的费用就比普查小。在美国,政府说进行的最查小。在美国,政府说进行的最重要的经常性调查,使用的样本重要的经常性调查,使用的样本在在105,000人左右,或者说大约人左右,或者说大约从从1240人中抽取一个人。在市场人中抽取一个人。在市场研究中,可能只要对几千人的样研究中,可能只要对几千人的样本进行调查。本进行调查。管 理 学 院王雪华副教授速度较快速度较快 收集和综合样本资料要比收集和收集和综合样本资料要比收集和综合全面调查的资料更快些。在综合全面调查的资料更快些。在迫切需要有关的信息时,考虑这迫切需要有关的信息时,考虑
6、这一点是极为重要的。一点是极为重要的。管 理 学 院王雪华副教授应用范围较广应用范围较广 就能取得的信息的种类来说,就能取得的信息的种类来说,抽样调查可以发挥作用的范抽样调查可以发挥作用的范围更为宽广,而且具有更大围更为宽广,而且具有更大的灵活性。的灵活性。管 理 学 院王雪华副教授准确度较高准确度较高 在工作量减少以后,由于能雇用在工作量减少以后,由于能雇用质量较高的工作人员并对他们进质量较高的工作人员并对他们进行深入的训练,还由于实地调查行深入的训练,还由于实地调查工作可以受到更仔细的检查监督,工作可以受到更仔细的检查监督,调查资料的处理页能够完成,因调查资料的处理页能够完成,因此与可能进
7、行的全面调查相比,此与可能进行的全面调查相比,抽样调查可能取得更准确的结果。抽样调查可能取得更准确的结果。管 理 学 院王雪华副教授抽样调查的应用抽样调查的应用 联合国统计局经常发表由成员国进行联合国统计局经常发表由成员国进行的的“当前所关心的的情况的抽样调查当前所关心的的情况的抽样调查(Sample Surveys of Current Interest)”报报告。告。1968年的报告就列出了年的报告就列出了46个国家个国家的调查。这些调查很多是为了收集对的调查。这些调查很多是为了收集对国家计划显然很重要的情报,例如农国家计划显然很重要的情报,例如农产品产量、土地使用情况、劳动力的产品产量、
8、土地使用情况、劳动力的多少与失业人数、工业生产、批发与多少与失业人数、工业生产、批发与零售价格、人民健康情况与家庭的收零售价格、人民健康情况与家庭的收支等等。支等等。管 理 学 院王雪华副教授抽样调查的应用抽样调查的应用 离婚的原因(匈牙利),家庭用水的消耗离婚的原因(匈牙利),家庭用水的消耗量(以色列),乳牛的年龄结构(捷克)量(以色列),乳牛的年龄结构(捷克)以及职位空缺情况(美国)。在美国,大以及职位空缺情况(美国)。在美国,大多数的大城市中都有商业性的机构从事为多数的大城市中都有商业性的机构从事为顾客设计和进行抽样调查的业务。市场研顾客设计和进行抽样调查的业务。市场研究在很大程度上依赖
9、于抽样方法。工厂主究在很大程度上依赖于抽样方法。工厂主与零售商要知道人们对新产品的包装方法与零售商要知道人们对新产品的包装方法的反应,对老产品的批评以及他们喜爱这的反应,对老产品的批评以及他们喜爱这一种产品,不喜爱另一种产品的原因。一种产品,不喜爱另一种产品的原因。管 理 学 院王雪华副教授抽样调查中应当注意的问题抽样调查中应当注意的问题要更据调查的目的确定合理的要更据调查的目的确定合理的调查总体调查总体明确待收集的数据都与调查目明确待收集的数据都与调查目的有关并且没有遗漏基本数据的有关并且没有遗漏基本数据根据精度要求,选择恰当的抽根据精度要求,选择恰当的抽样方法和方案。事先对所需费样方法和方
10、案。事先对所需费用和时间加以估计,在小范围用和时间加以估计,在小范围内预先试验,改进方案。内预先试验,改进方案。有效组织现场实地的调查工作。有效组织现场实地的调查工作。管 理 学 院王雪华副教授抽样方法抽样方法1 简单随机抽样(独立的、有代表性简单随机抽样(独立的、有代表性的、等可能性的)的、等可能性的)简单随机抽样也叫完全随机抽样,它是简单随机抽样也叫完全随机抽样,它是在无限总体中进行的无放回独立或在有在无限总体中进行的无放回独立或在有限总体中进行的有放回随机抽样。任一限总体中进行的有放回随机抽样。任一样本被抽取的概率都是相等的情况,像样本被抽取的概率都是相等的情况,像平时的抽签,借助随机表
11、进行的抽样等平时的抽签,借助随机表进行的抽样等就是简单随机抽样。就是简单随机抽样。-不重复抽样与重复抽样之分不重复抽样与重复抽样之分管 理 学 院王雪华副教授抽样方法抽样方法2 分层抽样分层抽样 将总体中的成员按某种原则划分成将总体中的成员按某种原则划分成若干个子总体,每个子总体称为一若干个子总体,每个子总体称为一层,在每层中进行简单随机抽样或层,在每层中进行简单随机抽样或其它抽样,称为分层抽样。分层抽其它抽样,称为分层抽样。分层抽样适用于调查既需要对总体又需要样适用于调查既需要对总体又需要对局部进行估计的情况。如调查大对局部进行估计的情况。如调查大连市民的收入情况。连市民的收入情况。(当层内
12、差异比(当层内差异比较小,而层间差异比较大时,分层抽样较小,而层间差异比较大时,分层抽样可以提高估计的精度。)可以提高估计的精度。)-不重复抽样与重复抽样之分不重复抽样与重复抽样之分管 理 学 院王雪华副教授抽样方法抽样方法3 整群抽样整群抽样 将总体中的成员分为若干群,从这些群将总体中的成员分为若干群,从这些群中抽取部分群,调查对象是被抽中的这中抽取部分群,调查对象是被抽中的这些群中的所有成员。如民主选举前的民些群中的所有成员。如民主选举前的民意测验。(当群内差异比较大,而群间意测验。(当群内差异比较大,而群间差异比较小时,整群抽样比较准确差异比较小时,整群抽样比较准确)4 系统抽样系统抽样
13、 等距抽样等距抽样.准确性差准确性差 将总体中的调查单位按某种次序排序,将总体中的调查单位按某种次序排序,随机地选定初始单位,然后按相等的间随机地选定初始单位,然后按相等的间距抽取其它样本单位。(要求对调查单位距抽取其它样本单位。(要求对调查单位的排序次序必须进行细致研究)的排序次序必须进行细致研究)-不重复抽样与重复抽样之分不重复抽样与重复抽样之分管 理 学 院王雪华副教授数据的整理数据的整理 为了探寻大量观测的样本数为了探寻大量观测的样本数据中所隐藏的统计关系,有必据中所隐藏的统计关系,有必要对数据加以整理和归纳。要对数据加以整理和归纳。数据的描述性指标数据的描述性指标 图、表图、表表示表
14、示管 理 学 院王雪华副教授数据的描述性指标数据的描述性指标例子:某班例子:某班30名名MBA 学生的年龄按学生的年龄按上升顺序排列为:上升顺序排列为:2727 28 28 28 28 29 29 29 29 30 30 30 30 30 31 31 31 31 31 32 32 33 33 33 33 34 34 34 35。数据集中趋势的度量数据集中趋势的度量数据离散趋势的度量数据离散趋势的度量管 理 学 院王雪华副教授数据集中趋势的度量数据集中趋势的度量众数众数#30,31;中数中数#-30.5;平均数平均数#-30.67;上四分位数上四分位数#-x23;下四分位数下四分位数#-x827
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据的搜集与整理 数据 搜集 整理
限制150内