现代心理与教育统计学复习资料覃瑞.doc
《现代心理与教育统计学复习资料覃瑞.doc》由会员分享,可在线阅读,更多相关《现代心理与教育统计学复习资料覃瑞.doc(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现代心理与教育统计学复习资料 赵晨鹰老师 覃瑞整理(21267529) 徐建平和张厚粲主编 第三版第一章 绪论课程简介: 先行课程为数学、普通心理学,后续课程为实验心理学、心理测量学、心理学研究方法、(研究型)毕业论文等。心理统计可分为三种类别(最常见的分类方法P8):第一部分是“描述统计”,包括数据整理、集中&离中&相关量数的计算等。 第二部分是“推论统计”,包括统计估计、假设检验等(以概率分布为基础)。 第三部分是“实验设计”,包括样本抽取、被试分组等。 描述统计 : 1统计图表 2集中量数 3差异量数 4相关关系 概率分布(推论统计的基础) 推论统计 :1参数估计 2假设检验 3方差分析
2、(涉及部分“实验设计”) 4 2检验 5非参数检验 线性回归(进而建立“数学模型”) 多变量统计分析简介 实验设计 : 抽样原理及方法 心理统计学(Psychological Statistics)是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。随机性数据资料随机现象P3 (vs. 确定现象) 试验之前已知存在多种可能结果,但不能预料哪种结果会出现; 在相同条件下可以重复该试验。理论统计学 vs. 应用统计学心理科学研究数据的特点 P2 1、分散性:数据结果均以一个个分散的数字形式呈现。2、变异性/随机性:观测数据总在一定范围
3、内随机波动变化。 3、规律性:通过重复观测可发现其变化具有一定的特征与规律。 心理科学研究的目标就是在分析部分数据的基础上来推测其相应总体的特征。一、描述统计(descriptive statistics) P8 描述统计主要研究如何将实验或调查得到的大量数据进行图表整理或简缩成有代表性的数字(即统计量数),使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。 据分组、图表制作。 统计量/特征值P21的计算。 相互关系的描述及相关系数的计算。等等 描述统计只限于对试验样本所得观测数据的统计分析,不考察其总体的特性。二、推论统计(inferenti
4、al statistics) P9 推论统计是以描述统计为基础,从而解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特性。 数估计。 假设检验中的参数检验(Z检验、t检验、F检验等)。 计数资料的检验(2检验)。等等三、实验设计(抽样理论、被试分配原则等)一、变量(variable)、观测值、随机变量 P18变量:一个可以取不同数值的物体属性/事件。 事前无法预期结果的变量随机变量。事后测定的某一结果观测值/原始取值。 补充 概念理解 涉及“实验” 自变量(及其各水平) & 因变量(及相应的反应指标) 涉及“调查”,粗略对应于 属性变量 & 反应变量二、数据类
5、型 重点,结合实例理解 P16 1、按数据反映的测量水平(低高)区分为称名/类别、顺序/等级、等距、比率/等比数据划分标准:能否排序、有无相等单位-能否加减、有无绝对零点-能否乘除。称名数据/变量只区分属性或类别上的不同,只可计数、不能排序。如性别、学科、职业等。顺序数据/变量可排序,但无相等单位、不能加减。如等级评定、受教育程度、职称等。等距数据/变量有相等单位,但无绝对零点、能加减不能乘除。如摄氏温度、常用测验得分等。比率数据/变量有相等单位,有绝对零点、能加减乘除。如反应时、身高、体重等。二、数据类型 补充说明:高层次的数据包含了低层次数据的全部性质。因此,高层次的数据可以降级当作低层次
6、的数据来处理(如“统计分组” P25),但不提倡。数据类型直接决定统计方法的选用(如“是否为连续数据将使用完全不同的方法”、“相关系数的选用”等)。一般情况下,心理科学研究只要求观测数据达到等距层次,因为等距数据已完全符合绝大多数高级的统计方法。 二、数据类型 2、按数据的观测方法和来源,区分为计数数据/计数资料和测量数据/计量资料。提醒:计数资料不是原始取值/观测值,而是在观测值的基础上计算个数所得的数据。应该说,任何原始数据都可换算为计数资料。但通常只会将称名和顺序数据换算成计数资料,因此,常默认地将此两类数据等同于计数资料。提醒:不要看到人数/个数的就以为计数结果,它可能仍是观测值! 同
7、样,等距和比率数据更多是进行加减等代数运算,这两类被默认为测量资料。 二、数据类型 3、按数据是否具有连续性,区分为离散数据(对应的变量叫“离散变量”)和连续数据(连续变量)。注意: 这是针对原始取值/观测值的划分,其标准就是理论上任意两个数据点之间能否细分出无限多个大小不同的数值。 称名和顺序数据属于离散数据,等距和比率数据属于连续数据。三、次数、比率、频率与概率 P19次数/频次/频数:某一事件在某一类别中出现的数目。 比率:同类别中不同事件出现数目之比。 频率/相对次数:某一事件数目与此类别所有事件数目之比。 这三个概念均由实际计数资料/样本计算所得。 概率:某一事件在无限观测中所能预料
8、的相对出现次数。(理论值/期望值)四、总体、样本、个体 P19总体:所欲研究的具有某种特性的一类对象的全部(样本空间)。(有限总体/无限总体) 个体:构成总体的每个基本单元。 样本(sample):从总体中按一定规则抽取的作为观测对象的一部分个体。 样本中所包含的个体数量即为样本容量/大小(大样本 vs. 小样本)对于一个(相对)无限总体而言,可以抽取出无限多个不同的样本。五、参数和统计量 P20 (总体)参数:描述总体特性的统计指标。 (样本)统计量/特征值:描述样本特性的统计指标。知识点链接:参数检验 vs. 非参数检验 P343,其区别就是“是否需要考虑总体分布/参数的情况”。“参数是一
9、个常数;统计量是一个变量。” 提醒:两者在符号上的区别通常,参数希腊字母,统计量英文字母。一定要注意各种统计指标的符号规范化不同情形,对应于不同统计方法的选用一、研究目的不同 差异检验:如t检验、方差分析、卡方检验等。 关联分析:如相关分析、回归分析等。二、被试分配不同 无一一对应关系的各组数据独立样本。有一一对应关系的各组数据相关样本(同批被试样本或配对样本)。三、数据类型不同 连续数据t检验、方差分析、积差相关等参数分析。离散数据卡方检验、等级相关等非参数分析。 四、样本的多少 单样本、双样本、多样本。(均为连续数据、进行均值比较时,前两者用t检验、后者用方差分析)五、自变量的多少 单因素
10、、多因素。(均为连续数据时,可用方差分析、及回归分析等)中英文对照: 描述统计descriptive statistics 推论统计inferential statistics变量variable 观测值observation 称名数据nominal data 顺序数据ordinal data 等距数据interval data 比率数据ratio data 计数数据count data 测量数据measurement data 离散数据discrete data连续数据continuous data 频次/频数frequency 概率probability 总体population 样本sa
11、mple 参数检验parametric test 非参数检验non-parametric test第二章 统计图表 一、数据的统计分组 统计分组是根据被研究对象的特征,将所得数据划分到时各个级别中去。 应注意的问题 P26 分组要以被研究对象的本质特性为基础(即要有理论或实践支持)。分类标志的确立必须坚持穷尽性和互斥性原则。 穷尽性:必须使全部数据都能归到某类中。 互斥性:必须每个数据只能唯一被归入某类中。 分组标准按形式可分为性质类别(常用于离散数据)与数量类别(常用于连续数据)。二、统计表既用于原始数据的整理(如被试构成),也用于检验结果的报告。注意事项:常用三线表(顶线、底线、栏目线);
12、标题置于表的上方;表号通常为阿拉伯数字123;尽量简洁明了。次数分布主要表示数据在各个组/类中的散布情况,即将原始资料转换为计数资料。次数分布表/图适用于各类数据的计数资料。一、简单次数分布表(如,表2-1) 直接对每个观测值进行计数。适用于许多心理测验或调查(单一题项)的结果(通常为离散数据)。 二、分组次数分布表(如,表2-2、表2-3的“f”列) 先划分若干分组区间,再对原数据进行归组并计数。适用于许多心理测验(总分)或实验的结果(通常为连续数据)。二、分组次数分布表编制步骤: P32 求全距(最大值与最小值之差) 决定组距与组数列出分组区间(精确组限、组中值):注意核实是否满足穷尽和互
13、斥原则。登记并计算次数编制次数分布表优缺点:这样做虽然使无序的数据变得有序、能了解分布情况;但有部分信息丢失了,所得数据与原数据有一定的出入(归组效应)。因此,进一步的统计最好仍用原始数据。三、相对次数分布表(如,表2-3的“P”列与“%”列) 四、累加次数分布表(如, P36表2-4) 五、双列次数分布表:适用于2个变量(可以为离散或连续)的计数资料。(如, P38表2-6) 六、不等距次数分布表(用于连续数据的计数资料,根据实际情况来确定)第三节 次数分布图本节内容是基于连续数据的次数分布表。一、直方图(如,图2-3、图2-4,略有误) 组距确定矩形宽度,每组频数确定各矩形高度,各矩形间不
14、留空隙,矩形面积与其频数分布大小等价。二、次数多边形图/折线图(如,图2-5)P40 在直方图基础上,通常以各矩形高端线段的中点连线而成(两端虚线延伸)。补充:单峰分布/多峰分布三、累加次数分布图 P41 1、累加直方图(如,图2-7) 2、累加折线图 累加曲线图(如,图2-8):分正偏态、正态、负偏态三种(如,图2-9)补充:折线图 曲线图:分正偏态、正态、负偏态三种(如,P66图3-3)第四节 其他类型的统计图表一、其他常用的统计表类型 P43 简单表、分组表、复合表主要适用于测量资料及其统计结果呈现(通常为三线表)。二、其他常用的统计图类别 P45 1、条形图/直条图/棒图:适用于离散数
15、据的计数资料(可对应于“简单次数分布表”)及其他可按实际需要选择其中的某种类型。(如,图2-10) 以条形的长短表示各事物间数量的大小。条形图与直方图的区别:适用资料不同;横轴标尺不同;图形形状不同。2、圆形图/饼图:适用于离散数据的计数资料,通常以百分数表示。(如,图2-11)3、线形图:最常用的图示方法,用以描述两个或两个以上变量(如,自变量和因变量)之间的函数关系,通常适用于连续数据(也可用于顺序数据)。(如,遗忘曲线;有误:如,P41图2-6) P47自习 线形图的绘制要点(与折线图的区分)4、散点图:适用于连续数据,用点的分布形态来表示两种现象(如,两个因变量的成对数据)之间的相关程
16、度。(如,图2-12)第三章 集中量数第一节 算术平均数 第二节 中数与众数 第三节 其他集中量数 对数据分布情况的量化描述主要有两方面的指标:数据的中心位置;数据的分散/变异程度。集中趋势数据向某方向的集中集中量数(数轴上的一点)离中趋势数据彼此的分散程度离中/差异量数(数轴上的一段距离) 两者一起描述一组数据的全貌。(针对连续数据)最常用的即为平均数和标准差。第一节 算术平均数 P54一般简称为平均数(average)或均值(mean)。符号为M,区分总体/样本平均数。适用资料:等距数据及以上/连续数据。一、平均数的计算 自习,包括“使用次数分布表计算平均数的方法” P56 二、平均数的特
17、点 : 离均差总和为0。 每个数加上C,则所得平均数为原平均数加上C。 每个数乘以C,则所得平均数为原平均数乘以C。三、平均数的意义:多数情况下它是真值的最好估计值。 四、平均数的优缺点 1、优点:反应灵敏。计算严密。计算简单。简明易解。 适合于进一步代数演算。 较少受抽样变动的影响。2、缺点:易受极值的影响。“修剪平均数” 据不够确切,则无法计算该样本平均数。“缺失值(missing values)的处理” 五、计算和应用平均数的原则 1、同质性原则:同质的数据才有计算平均数的意义。 2、平均数与标准差、个体数值相结合的原则:描述数据分布特征不能仅依赖于平均数,还需考察标准差以及个体数值等。
18、第二节 中数和众数一、中数 P61 又称中位数/中点数,符号为Md(Median),是指一组数据中位于较大一半与较小一半中间位置的那个数。 适用资料:顺序数据及以上。 1、一般计算方法(区分数据个数为奇数/偶数)补充 复杂情况:数列中间出现重复数值;分组数据。2、优缺点与应用 优点:计算严密;计算简单;简明易解。 缺点:反应不灵敏;不适合进一步代数演算;受抽样变动影响较大。二、众数 P64 又称范数/密集数/通常数,符号Mo(Mode),是指一组数据中出现次数最多那个数。 适用资料:称名数据及以上。 1、一般计算方法:直接观察 自习 公式计算 2、优缺点与应用 优点:简明易解。 缺点:反应不灵
19、敏;不适合进一步代数演算;受抽样变动影响较大。 三种集中量数的关系:正态分布中三者相等,正偏态中M Md Mo,负偏态中M Md Mo。 P66第三节 其他集中量数一、加权平均数:适用于等距数据;二、几何/对数平均数:适用于比率数据,用于描述增长比率等方面的问题。 例3-8计算不当三、调和/倒数平均数:适用于比率数据,用于描述平均速率等方面的问题。04第四章 差异量数 第一节 全距和百分位差 第二节 平均差、方差与标准差 第三节 标准差的应用:差异系数和标准分数 第四节 差异量数的选用 第一节 全距和百分位差 一、全距 P80 又称两极差,用最大值与最小值之差来表示离中趋势,符号R(range
20、),公式 计算所得数值越大,表明数据越离散/分散 下同 适用于等距数据及以上(将就也会用于顺序数据);最简明、最低效,常用于预备性检查。二、百分位差 P81 用百分位数之间的差值来表示离中趋势,常用的有P90-P10、P93-P7。 补充 原始排名的百分等级计算(算的是,如果你在N人里排名是R,那么类推到100人里你排名是多少 ) PR为百分等级,R为排名序号,N为总数据个数。P174四分位差(及四分位数)P84,可视为百分位差的一种,符号Q(quartile deviation),公式Q =(P75 - P25)/2(即第三个四分位数与第一个四分位数之差的一半)适用于等距数据及以上(将就也会
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 心理 教育 统计学 复习资料
限制150内