心理学考研大纲解析--心理统计.docx
《心理学考研大纲解析--心理统计.docx》由会员分享,可在线阅读,更多相关《心理学考研大纲解析--心理统计.docx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、考研考业傭大綱解析図理統计学心理统计大纲解析、描述统计心理统计中常见的基本概念厶变赍及其种类(1)变量变冨!又称随机变量,即不断变化的,可取不同值的量。如实验中出现的自变量、因变 量与额外变量(2)变量与数据的区别心理统计学中,一旦对变量进行了观测,或者进行了取值,这个数值也就是这个变量 的一个观测值,即随,个变量可以有无数多的数据值。(3 )变量和数据的分类1 .根据变量性质的划分名称变量:如性别、颜色等,也称类目变量,若属性只有两种结果,亦称二分名 称变量。其所属数据是计数数据,即各类属的数量。顺序变量:按事物的某属性的大小或多少按顺序排列起来的数据,相邻两个等 级的间隔是不等距的,只有等
2、级上的差别,无单位又无绝对点。等距变量:这类数据只有相等的单位,而无绝対点,如测验分数、温度等。比率变量:又称等比变量,是种既有相等单位,又有绝对零点的变量,如距离、 时间、人的身高、体重等。后三种变量的数据都是用一定的测量工具或测量标准测量时所获得的数据,统称度 量数据2 .根据变量的连续性划分连续变量:即可无限划分的变量,如长度可划分为千米、米、厘米、微米等离散变量:指测量单位间不能再细分的数据,常取整数,如名称变量3 .根据变量间的关系划分:即自变量、因变量与额外变量的划分2統计得初步厠利是指具有某些共同的,可观测特征的类事物的全体恒是构成总体的基本单位或单元,又称元素或个案因困即从总体
3、中抽出的一部分个体,一般30以上的样本称大样本,30一下的称小样本惨面是总体的特征量数,一般只是理论假设时存在,实际无法测量,如(总体平均数)、0 (总体标准差)、p (总体相关系数)等国计国则是直接从样本计算出的量数,代表的是样本的特征,如M (样本平均数)、S(样本标准差)、r (样本相关系数)等(-)统计图表统计表和统计图都是对数据进行初步整理,以简化的形式加以表现的两种最简单的方 式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:(1)数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排 列,其具体方法一般有如下三种:顺序分布法:将数据按大小排列,后用频数
4、f表示相同数据的出现次数等级分布法:先按顺序排列数据,后以事物本身的性质标上相应的等级R,若 有重复等级时,应在划分等级时根据其实际的排序位置求平均等级次数分布法(2)统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去刀統計囹统计图I:用点、线、面的位置、升降或大小来表达统计资料数量关系的种陈列形式 组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注图形的种类:直条图(条形闇)和圆形图(饼图)都是用于绘制离散型数据的统计图次数多边形图(线性图)与直方图是用于绘制连续型数据的统计图散点图则是用于表示对事物相互关系的统计图此外还冇茎叶图、测量中用来,示结果的剖面图等2统計表统计表I
5、:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的 种表现形式组成:隔开线、表号、名称、标目、数字、表注分类:简单表、分组表、复合表次数分布表的编制过程与方法:(1)求全距(Range, R)人=x111ax - Xmin(2)定组数和组距经验法是根据经验将数据分为1020组,其中1015组为最佳,组距一般选择2、 3、 4、 5、 10 等当数据来自于个正态分布的总体时,可以用计算法:k = 1.87(N-l); i = % 或i =(十%;其中i为组距,k为组数(3)定组限邈!是指每组的起止点表达界限:即根据第二步人为确定的上下限精确界限:上限or下限分别+/- 0. 5
6、(或0.05、0. 005)所得的界限(4)登记与汇总即写出各组频数f与总数Ef(-)集中量数集中量数|即表示集中趋势的种参数或统计量,反映的是频数分布中大量数据向某一点集 中的情况。算木牛的報(1 )定义算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数。X =-N(2 )特点在一组数据中每个变量与平均数之差的总和等于零:2(X-X) = 0在组数据中,每个数都加上一个常数C,所得的平均数为原来的平均数加常数 C:-Z(X.+C) = X+C在组数据中,每一个数都乘以个常数C,所得的平均数为原来的平均数乘以常 数C:-s(x,c)= xc(3)意义算数平均数是应用最普遍的种集中量
7、数,它在大多情况是真值最好的估计值。2超(1)定义:画:按顺序排列在起的一组数据中居于中间位置的数,在这组数据中,有一半数据 比它大,半数据比它小,以Md或Mdn表示。(2)算法:数列总个数为奇数时,第(N+D/2个数就是中数数列总个数为偶数时,可取位于中间的两个数的平均数作为中数分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限 使用插值法注:冇相等数数列的中数计算:不容易,要自已好好摸索,我通常是釆取如下方法:总个数为奇时取第(N+D/2个数的组中值: 总个数为偶时取第N/2个数的精确I:限与第(N+D/2个数的精确限的均值3.众扱众数:在次数分布中出现次数最多的那个
8、数的数值,以Mo表示。众数可能不只一个。均数、中数、众数的关系与应用比较:(1)关系当数据分布呈正态时:M = Mdn = Mo呈偏态分布时,众数位于峰值最高点上,中数位于均值与众数之间,且有Mo = 3Mdn- 2M即正偏态分布时Mo Mdn M:负偏态分布时M Mdn lXlX2主要用于:1. 组数据中有少数数据偏大或偏小,多用于心理物理学的等距与等比量 表中;2. 组数据彼此间变异较大,且几乎是按定比例关系变化时。(2 )调和平均数多用于描述速度方面的集中趋势(三)差异量数离差I:分布中的基点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数 值表示了它们之间的绝对距离。x =
9、X 数列中所有数的离差之和始终为零,因此不同数据间差异无法用离差来比较。 TOg:次数分布中所有原始数据与平均数绝对离差的平均值。缺点:进行了绝对值处理,无法进行下步代数运算2方差与标港差由于离差正负值互相抵消无法代表离中趋势,我们引入和方的概念画I:每个离差值平方求和ss= ()2=;_ Z(总体的方差和标准差gg:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数 作为样本统计量用符号表示,作为总体参数用符号表示,也叫均方。2 SS=N标准差I:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号0表示。(2)样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小。
10、为了校正样本数据带来的偏差,在计 算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:宀n-方差、标准差的合成:s;=乙S+ZM%n其中d =(J(3)性质每个观测值都加一个相同的常数c之后,计算得到的标准差等于原来的标准差每个观测值都乘以一个相同的常数c,所得到的标准差等于原标准差乘以这个常数 (4)意义方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中 最常用的差异量数3.变异糸報当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相対差 异量数,最常用的就是变异系数。两个或两个以上样本所使用的观测工具不同,所测的特质
11、相同两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平芥异较 大变异系数I:种最常用的相对差异量,为标准差对平均数的百分比cv =4xioo%使用变异系数时应注意:所用数据应都是等比数据;只能用于描述,不可进行统计推论。各种差异量数间的比较:方差与标准差全距平均差优点1 .感应灵敏2 .严密确定3,适合代数法则处理4,受抽样变动影响小1 .意义简明2 .计算简单1 .意义简明2 .计算简单3 .严密确定缺点1 .原理难理解,计算复杂2 .受极端值影响较大1 .极易受极端值影响2 .无法反映全部数据的差异 情况1 .易受极端值影响2 .不适合代数运算应用1 .反映数据离散程度2
12、 .进行推论统计和检验使用价值很小少用3 .用判断数据可否舍弃4 .计算CV、Z和标准误(四)相对量数I.石令佐超百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比所对应的分数,实 质上就是在某个百分位置上的数值。第p百分位数就是指,在某值为p的数据以下,包括分布中全部数据的飕。2节今昔做I百分等级I:常模团体中低于该分数的人所占总体的百分比: = ioo-1QO/?50N其中R为某一原始分数在按大小排列的数列中的名次百分等级的应用:1.建立百分等级常模:2.衡量考绩的优劣:3.比较群体间成绩的优劣。3.希苑今惑.(1 )定义标准分数I:以标准差为单位表示一个原始分数在团体中所处位置
13、的相对位置量数,也叫 Z分数,表示原始分数在平均数以上或以下几个标准差的位置。Z-X1S(2 )性质Z分数无实际单位,是以平均数为参照点,以标准差为単位的一个相对量 组原始分数转换得到的Z分数可正可负,其分布形状与为转换前的原始分布相同原始数据的Z分数分布标准差均为1若原始分数呈正态分布,则转换得到的均值为0I标准差为1的标准正态分布(3)应用比较不同测量单位时变量值的相对位置计算不同质的观测值得总合或平均值,以表示在团体中的相对位置异常值的取舍(通常在个正态分布中,若一个数据的取值落在土3之外,则在整理 数据时可将此数据作为异常值舍弃)学习时需要记忆几个经典Z分数及其对应的百分比值:1S=3
14、4.14%; 2s=47.72%;3s=49.875%; 1.64S=45%; 1.96S=47.5%; 2.33S=49%: 2.58S=49.5%(4)导出分数导出分数梗是为克服Z分数的某些不足而对其进行线性变换所得的分数,其转换形式为Z=aZ+b,转换后分布均值为b,标准差为a。儿种常见的导出分数:正态化标准分数:T=10Z+50注:分数分布的转换有两种,一种是正态化转换,即根据原始分数计算出百分等级,再 查正态分布表得到每个数据的P值,由此将整个分布转换为正态分布,这是种非线性转换: 另种即是由Z分数经公式直接转换为T分数,这就是线性转换了,若不经正态化,其分数 分布仍与原始分数的分布
15、形态一致。组非正态数据若要转换为正态化标准分数,则同时需 要以上两步转换过程。韦氏成人智力量表:IQ=15Z+100比奈一西蒙量表:ZL16Z+100(五)相关量数由于实验法适用范围的限制有的时候我们只能对变量间进行相关研究,也就是看两者是杳 有互相跟随的变化关系。相关研究所得到的是种描述统计,我们仅仅姐用其描述两个变更 互相跟随的程度大小,至于他们之间是否有因果关系或者是共交关寐则不可妄下定论。相关系魏两列变量间相关程度的数字表现形式作为样本的统计量用r表示,作为总体参数一般用p表示。正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相 反的变动
16、零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化测定系数I:相关系数的平方,用以说明两列变量的变异中一方能由另一方解释的程度。如 两组数据间相关为0. 8,那么我们可以说当以A来预测B的变化趋势时,64%是 正确的。使用相关系数时应注意:相关系数受样本量n影响,n最好不小于30;相关系数不是等 距数据;计算相关要求成对数据:相关可能是线性也可能是非 线性。刀积麦相关积差相关是直线相天中最基本的方法,山英国统计学家提出,因此也叫Pearson相关, 用表示,廿宀匡口X和共同变化的程度和的第方差其头是:r = X和各自变化的程度和設自的方差(1)使用前提数据要成对出现,即若干个体中每个
17、个体都有两种不同的观测值,且每对数据与其它 对相互独立两列变量各自总体的分布都是正态的,至少接近正态两个相关的变量是连续变量,也即两列数据都是测量数据两列变量之间的关系应是直线性的(2)公式 一一SP殍SSxSSy X)归2(Z N2塔秋相关等级相关是根据等级资料来研究变量间相互关系的方法,按因变量个数的多少分为用于 分析两列量的斯皮尔曼相关和用于分析多列变量的肯德尔等级相关(1)适用范围当研究考察的变量为称名数据或顺序数据时虽是等距或等比数据,但总体分布不是正态,或者两者间关系不是线性时(2)公式:将原始数据转化为顺序型数据,后用Pearson相关公式或以下公式计算6D2 r=4 N(N-1
18、)其中D为同一个体的X和丫各自排序后的等级差,N为成对等级变量的对子数3.3德尔等無相糸(1)肯德尔W系数也叫肝德尔和谐肅,原始数据资料的获得一般采用等级评定法,即让K个被试对N 件事物进行等级评定,或同一个人先后K次评定N个事物。其原理是以评价者评价的一致性除以最大 变异可能性。Ri!评价对象获得的K个等级之和N:等级评定的对象的数目K:等级评定者的数目。(2)肯德尔U系数与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配 对,即配成N(N+l)/2对,分别对每对中两事物进行比较,优者记1,劣者记,最后整理所有评价者 的结果。(丄N( 1K(K - 1)用为对偶比较记
19、录表中ij格中的择优分数。注:U系数的取值范围在。1之间,为1时,意味着评分者的意见完全一致;当U为-(奇K数)或一一(偶数)时,意味着评分者意见完全相反,而U取值的正负并不表示一致的 方向。,豈二列相关S二列相关(1)点二列相关适用于一列数据为正态等距变量,另一列为离散型二分变量的情况,可用于计算二分计 分题目的区分度。v。是与二分称名变量的一个值对应的连续变量的平均数Y“是与二分称名变量的另个值对应的连续变量的平均数P与q是二分称名变量两个值各自所占的比率,st是连续变量的标准差(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。 .尤兄pqrh yy为标准正态曲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理学 考研 大纲 解析 心理 统计
限制150内