统计与统计学.doc
《统计与统计学.doc》由会员分享,可在线阅读,更多相关《统计与统计学.doc(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date统计与统计学SPSS在教育统计与统计学统计:总括起来计算,是对某一现象或事物的有关资料进行搜集、整理、计算、分析的工作过程。统计有三层含义:1、统计资料(statistical data),即反映各种现象的数据资料;2、统计工作(statistical work),即具体搜集、整理、分析统计资料的工作过程;属于统计实践的过程 3、统计学(statistics),即研究
2、统计原理与方法的科学。为这种实践提供理论与方法的学问 统计学 :依据其作用分类1、应用统计学:与研究对象的特征密切结合的各科专门统计,如人口、 医药、经济、工业、体育、生物等,以本学科现象的数量形式为基础,对它们的规律性进行数量上的分析研究。教育统计学亦属于应用统计学的范畴2、数理统计学:为各门应用统计学提供数理方法基础的一门学科,其内容主要是运用概率的知识解释统计数据数量关系的模式。教育统计教育统计学(educational statistics):专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简
3、言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。教育统计工作:各级教育行政管理部门的教育统计报表和相应制度,它作为教育行政部门管理系统的一部分,着重于统计数据的收集和管理工作。统计学的内容多元统计分析:进行教育或心理的研究和实验,常会受到多种因素的影响。而寻找主要的影响因素,把相近或相关的 因素合并或归类则是多元统计分析的主要任务。多元分析增强了心理与教育研究和实验的可靠性与准确性,使研究更贴近客观实际。 多元分析的理论深奥,计算复杂,因此在很长一段时间其应用受到限制。直到计算机技术发展与普及的今天,有了专门成熟的统计软件包,才使得多元统计分析法获得广泛的应用。
4、 多元统计分析的主要内容有主成分分析、因素分析、聚类分析、多元方差分析、多元回归分析等等。模糊统计学:教育、心理现象的不确定性,不仅表现为随机性,而且更多地表现为模糊性。因此,对心理与教育现象进行模糊性的描述也是必然的,不可缺少的。预备知识:变量与数据变量(variable):又称随机变量(random variable)。数学中把不断变化的,可取不同值的量称为变量;统计学则因观测数据具有变异性的特点(即数据总是在一定的时空范围内不断变化而具有变异性)称其为变量(即,具有变异性的数据)。如:学生身高。-数据(data)与变量:在统计学中把在取值之前不能预料到将取什么值的量称为变量(随机变量);
5、如果某个数值一旦被取定,则称这个数值为随机变量的一个观察值,即数据。变量的分类1、 名称变量(nominal variable),指一事物与其他事物在属性、类别上不同;如:性别、颜色。名称变量的统计方法主要有次数计算、百分比、2检验、相关等。2、 顺序变量(ordinal variable),事物的某一属性的多少或大小按顺序排列起来的变量;如:教师按能力大小或成绩高低排列等级。顺序变量的常用统计方法有中位数、百分位数、等级相关、秩次检验等。3、 等距变量(interval variable),数据具有相等的单位,但没有绝对零点;如:能力测验或知识测验。等距变量常用的统计方法有平均数、标准差、t
6、检验、F检验、积差相关等。4、 比率变量(ratio variable),一种既有相等的单位,又有绝对零点的变量,又称等比变量;如人的身高与体重、距离、时间、教育投资、学校固定资产金额等。比率变量常用的统计方法除了上述方法外,还有几何平均数、相对差异量数等。预备知识:统计术语初步总体与个体总体(population):客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。统计总体具有同质性、大量性和差异性的特征,只有同时具备这三个特征才能形成真正意义上的统计总体。个体(individual):构成总体的基本单位或单元,又称元素或个案。样本
7、与样本容量样本(sample):从总体中抽出的一部分个体。样本容量:样本中所包含的个体数目,或称样本含量,用符号N或n表示。大样本(large sample)的容量一般在30以上或40、100以上,小样本(small sample)的容量在30以下。参数与统计量参数(parameter):表示总体特征的量数,一般用希腊字母表示,如总体平均 数(mu),总体标准差(sigma),总体相关系数(rho)等。字符表示,如,样本平均数或M,样本标准差S,样本相关系数r等。标志(mark):统计总体中各个个体共同具有的属性和特征,它是说明个体属性和特征的名称,如个体的性别、文化程度、年龄、职业、民族、个
8、体的记忆力、思维力、想象力。品质标志:表明个体属性特征,不能用数量说明,只能用文字说明,如性别。数量标志:表明个体数量特征,用数值表示,如年龄。指标(index):表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果,必须 用数量表示。作为一个统计指标必须具备五个要素:指标名称、计量单位、时间、地点、数量。如某大学2005年本科生招生人数6000人,其中指标名称是本科生招生人数,计量单位是1人,时间是2005年,地点是某大学,数量是6000。绝对数与相对数绝对数(absolute number):用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展
9、水平的统计指标,又称总量指标。绝对数量能具体反映各种事物的实在数量,在统计工作中具有非常重要的意义。相对数(relative number):教育与心理现象中两个单位相同的互相关系的指标数值的比率,它比绝对数更清晰地反映现象之间的对比关系,能使个别现象从绝对数的差别中抽象出来,把不能直接比较的现象变成可比较的现象。 SPSS简介 SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS、SYSTAT)。伴随SPSS服务领域的扩
10、大和深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。 发展历程1968年:斯坦福大学三位学生创建SPSS;1968年:诞生第一个用于大型机的统计软件;1975年:在芝加哥成立SPSS总部;1984年:推出用于个人电脑的SPSS/PC+;1992年:推出WINDOWS版本,同时全球自SPSS 11.0起,SPSS全称为“Statistical Product and Service Solutions”;2009年:SPSS公司宣
11、布重新包装旗下的SPSS产品线,定位为预测统计分析软件 (Predictive Analytics Software,PASW),包括四部分:统计分析、数据挖掘、数 据收集、企业应用服务;2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBM SPSS字样。SPSS统计功能概述基础统计:包括描述性统计、探索性统计、列联表分析、线性组合测量、t检验、单因素方差分析、多维反应模型分析、线性回归分析、相关分析、非参数检验等。专业统计:包括判别分析、因子分析、聚类分析、距离分析、可靠性分析等。高级统计分析:包括Logistic回归分析、多变量方差分析
12、、重复测量方差分析、多协变量方差分析、非线性回归、Probit回归分析、Cox回归分析、曲线估计等。SPSS统计功能概述数据的搜集、整理与表达 统计工作过程的三大相互依存的基本环节 数据的搜集不仅是统计工作的首要环节,而且还是全部统计工作的基础。数据资料的来源: 经常性资料:日常工作中的记录和统计报表等。工作记录,如学校中关于教师资历、教学情况、教学进度的记录,关于学生学期、学年成绩和操行评定的记录,关于学生健康状况、流失情况的记录,关于学校经费的使用、学校建设的记录,教师的工作记录等;统计报表,如教师职称变动的年报表、学生流失率的季报表、学生入学率的年报表等。 一时性资料:在一定时限内所收集
13、的有关问题的资料。主要来源于三个方面,即教育与心理调查、教育与心理测量、教育与心理实验。数据的整理,可使数据变得简约直观,且显现出数据的分布特征。数据整理包括检查数据和整理方式。 检查数据:1、准确性:观测数据的真实可靠;包括检查逻辑性和检查计算。2、完整性:数据是否齐全、有无遗漏和重复。3、及时性:数据是否按规定时期报送。 整理方式:1、顺序分布法:将数据(X)按大小顺序先排列起来,然后用次数(frequency)表示相同数据的出现数目,形成一个简单次数表。2、等级分布法:首先按顺序排列数据,然后标上相应的等级(Rank),可分无重复等级的整理方式和有重复等级的整理方式。3、次数分布法:针对
14、数据量较大的情况。次数分布法是从一群数据中求其全距(range),决定组数、组距(interval)、组限(boundaries of group),然后进行归类汇总形成一个有规律的表式的数据整理方式,又称分组次数分布。数据的表达,观测数据经过整理之后需要用一定的方式表达出来,包括列表法(即统计表)和图示法(即统计图)。 列表法(即统计表) :统计表(statistical table)是以表格的形式表达统计资料数量关系的方式或工具。统计表可以简化资料,反映出事物的全貌及蕴含的特性,省去冗长的文字叙述,同时也便于分析、对比和计算。统计表的基本内容:线条、标题、标目、数字。统计表的种类 简单表(
15、simple table)“定语”部分未经分组,只罗列单位名称、地点、时序等的表 分组表(grouping table)“定语”按照一个分类标志进行分组的表格 复合表(complex table)“定语”按照两个或两个以上的分组标志进行多层分组所形成的表格 图示法(即统计图):统计图(statistical graph)是以几何图形和形象图形表示统计资料 数量关系的工具。统计图在表现事物的数量关系时比统计表更为形象、直观,给人的印象更加深刻,而且易于记忆。 从图形形状上分有 直条图(thermometer chart)、饼图(pie diagram)、直方图 (histogram)、折线图(l
16、ine chart)、散点图(scatter diagram) 从图形维度上分有二维图(即平面图)和三维图(即立体图) 从图形来源上分有几何图、象形图和统计地图SPSS的启动:启动SPSS,可双击桌面上IBM SPSS Statistics图标,也可以在“开始”菜单中依次选择All Programs IBM SPSS Statistics命令SPSS的常用界面与窗口(1)数据编辑窗口功能:对SPSS的数据文件进行录入、修改、管理等基本操作的窗口SPSS的常用界面与窗口(2)对象编辑窗口:在结果输出窗口的显示窗口中,直接双击其中的表格或图形均可打开该输出结果对应的对象编辑窗口: 在对象编辑窗口中
17、我们可以对表格、图表等进行相应的编辑。SPSS的常用界面与窗口(3)语法(syntax)编辑器窗口功能:编写和修改SPSS程序的窗口。脚本(scripts)编写窗口功能:允许用户使用Sax Basic语言(一种与Visual Basic兼容的编程语言)编写脚本语言程序,扩充SPSS的功能,如自定义非系统自带绘图格式功能、执行错误程序等。SPSS数据输入与整理 数据输入:SPSS界面定义变量输入数据保存数据数据分析保存分析结果1、 SPSS界面:打开SPSS,为一空白数据编辑窗口“SPSS Data Editor”。2、 定义变量:单击“Variable View”(变量视图窗口),该视图的每行
18、各表示对一个变量的定义,每列表示定义该变量时所用的某种属性,如名称(Name)、变量类型(Type)等。定义变量后,单击“Data View”(数据视图)。3、 输入数据:输入变量的值,确认一行一列单元格为当前单元格。4、 保存数据:单击“File”,选择“Save”,若该数据从未被保存过,故弹出“Save Data As”对话框。数据整理1、 单元值的修改,直接在每个数据单元中进行修改。2、 增加和删除一行数据(一个个案)。单击“data”,选择“insert case”(delete)命令,也可选中一行,再击右键,选插入(删除)。3、 数据的排序。单击“data”,选择“sort case
19、”命令,弹出“sort case”对话框,在左框中选取一个需要按其数值大小排序的变量(也 可多个)添加到右框图中,并选择按升序还是降序,按“OK”即可。4、 数据的行列互换。将数据管理器中原先按行(列)方向排列的数据转换成列(行)方向排列,即将个案和变量进行转换。这时单击 “data”,选择“transpose”,弹出其对话框,再在变量名列表中选择1个或多个需转换的变量,使之添加到“variable(s)”框中,单击“OK”即可。5、 选择个案子集。在数据统计中可从所有资料中选择部分进行统计分析,单击“data”,选择“select cases”命令。集中量数 集中趋势(central ten
20、dency) 在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势,它是数据分布的特征之一。 集中量数(central measures) 用于描述观测数据集中趋势的量数是一组数据的代表值,用以说明一组数据分布的典型情况或一般水平, 它比个别数据更能反映客观现象或事物的实际情况还可以用于组与组之间的差异比较 描述集中趋势的数量指标 算术平均数 、中数 、众数 、几何平均数 、调和平均数均数、中数、众数 算术平均数(arithmetic mean)所有观测值(或变量)的总和除以总个数所得的商,简称平均数、均数或均值。其符号系统既有表示样本平均数的数学符号和英文符号M,又有表
21、示总体平均数的希腊字符。中位数(median) 又称中点数,简称中数,用符号Mdn或Md表示。中位数是位于按一定顺序 排列的一组数的中央位置的数值,它是把一组数据按次数划分为两半,即 在中位数上下的数据分布各占一半。 众数(mode) 一群数据中出现次数最多的那个数值,又称范数,用符号M 0表示。 均数、中数、众数的关系三者的大小与次数分布的形态有关:均数、中数、众数的比较与应用 作为优良集中量数应当具备六个条件:1、 反应灵敏,即一群数据中任何一个数值的变动都会影响集中量跟着变动2、 严密确定,即该集中量指标应由全部观测值计算得来,而且同一组数用该指标不同计算方法计算出的结果相同,如定义式或
22、计算式或加权式等3、 意义简明,易于理解,即其方法不应带有过多的数学抽象性质4、 容易计算,即在其他条件相同的情况下,则以计算简便作为选择的依据5、 适合代数法则的处理,即可以用数学性质处理或简化数据6、 受抽样变动的影响较小,即从同一总体中抽样的多个样本,个样本的计算结果相同或相近 SPSS均数、中数、众数1、 录入数据;2、选“Analyze”,展开下拉菜单。单击“Descriptive Statistics”,再单击“Frequencies”,添加变量到“Variable(s);3、单击“Statistics”,选择“Central Tendency”中的“Mea,Median,Mode
23、,Sum”,再单击“Continue”,返回 “Frequencies”,单击“OK”即可差异量数 离中趋势(divergence tendency)统计分布的另一种特征,又称离散程度。 差异量数(divergence measures) 描述一组数据离中趋势的量数。 描述离中趋势的数量指标 方差 、标准差 、平均差 、全距 对一列数据分布的分析,不仅需要集中量数的指标,而且还需要差异量数的指标,只有二者结合起来才能对一列数据做出较为全面的分析方差(Variation) 离均差平方的算术平均数,表示一列数据平均差距的平方,其样本方差用符号表示,总体方差用符号表示。 方差又称变异数,用符号V(V
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 统计学
限制150内