2023年统计心理学学笔记.docx
《2023年统计心理学学笔记.docx》由会员分享,可在线阅读,更多相关《2023年统计心理学学笔记.docx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六部分心理记录学笔记(1)基本概念总体:具有某些共同的、可观测特性的一类事物的全体,构成总体的每个基本单元称为个体样本:由于不能或没必要对整个总体进行研究,我们只能从总体中选择出一些个体代表总体,这些个体的集合叫样本变量:自身是变化的或者对于不同个体有不同值得特性或条件常量:自身不变且对不同的个体的值也相同参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得到比例:全组中取值为X的比例,p=f/N插值法:一种求两个已知数值之间中间值的方法,其假设所求解点附近数据呈线性变化记录量:描述样本的数值,与参数的获得方式相同随机取样:从总体抽取样本的一种策略,规定总体中的每一
2、个个体被抽到的机会均等取样误差:样本记录量与相应的总体参数之间的差距偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布相应次数分布:一批数据在某一量度的每一个类目所出现的次数情况离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在连续型变量:在任何两个观测值之间都存在无限多个也许值,它可被分割成无限多个组成部分(2)学习建议将注意放在概念上,心理记录应当是一门概念性的科学,而非纯数学。一定要将记录方法与心理学研究的情景结合起来学习。弄懂一个概念再开始学习下一个,心理记录中的概念应用性较差却是之后做题的基础。做题按照推荐格式能避免犯错几率。(3)记录检查总表数据
3、类型单样本问题独立样本比较相关样本比较多组样本的比较相关问题独立样本反复测量等距型总体正态分布单样本t/z检查独立样本t/z检查相关样本t检查独立样本方差分析反复测量方差分析Pearson积差相关分布形态未知大样本下的相应的t/z检查大样本下的相应的t/z检查大样本下的相应的t检查转化为顺序型转化为顺序型顺序型符号检查法曼-惠特尼U检查维尔克松T检查克-瓦氏单向方差分析弗里德曼双向等级方差分析Spearman等级相关命名型2匹配度检查2独立性检查符号检查法2独立性检查2独立性检查一、描述记录描述记录是指用来整理、概括、简化数据的记录方法,侧重于描述一组数据的全貌,表达一件事物的性质。(一)记录
4、图表登记表和记录图简朴明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点。它们是对数据进行初步整理,以简化的形式加以表现的两种最简朴的方式。在制定记录图表之前,一般一方面要对数据进行以下两种初步整理:数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列记录分组:根据被研究对象的特性,将所得到数据划分到各个组别中去1记录图记录图:用点、线、面的位置、升降或大小来表达记录资料数量关系的一种陈列形式 组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注 分类:条形图、圆图、线性图、直方图、散点图、茎叶图2登记表登记表:将要记录分析的事物或指标以表格的形式列出来
5、,以代替烦琐文字描述的一种表现形式 组成:隔开线、表号、名称、标目、数字、表注 分类:简朴表、分组表、复合表(二)集中量数集中量数又叫集中趋势,是体现一组数据一般水平的记录量。它能反映频数分布中大量数据向某一点集中的情况。1算数平均数(1)定义算数平均数:即所有观测值的总和与总频数之商,简称为平均数或均数 平均数一般与标准差、方差相结合使用。(2)特点在一组数据中每个变量与平均数之差的总和等于零在一组数据中,每一个数都加上一个常数C,所得的平均数为本来的平均数加常数C在一组数据中,每一个数都乘以一个常数C,所得的平均数为本来的平均数乘以常数C(3)意义算数平均数是应用最普遍的一种集中量数,它在
6、大多情况下是真值最佳的估计值。(4)优缺陷优点:反映灵敏、计算严密、计算简朴、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺陷:易受极端数据的影响、不能在出现模糊数据时计算2中数(1)定义中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一般数据比它小,等价于百分位数是50的那个数。(2)算法数列总个数为奇数时,第 (n+1)/2 个数就是中数数列总个数为偶数时,可取位于中间的两个数的平均数作为中数分布中有相等的数时,将反复的数字当作一个连续体,运用中间分数的精确上下限使用插值法(3)优缺陷优点:计算简朴、容易理解、不受极端值影响、能在有模糊数据
7、情况下使用、可在顺序型数据时使用缺陷:代表性低、不够灵敏、稳定性低、需要排序、不能进一步做代数运算3众数(1)定义众数:在次数分布中出现次数最多的那个数的数值 众数也许不只一个。在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间。(2)优缺陷优点:能在数据不同质的情况使用,能避免极端值干扰缺陷:不稳定、代表性差、不够灵敏、不能做进一步的代数运算(三)差异量数差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的记录量,也称为离散量数。1离差与平均差离差:分布中的某点到均值得距离,其符号表达了某分属于均值之间的位置关系而数值表达了它们之间的绝对距离 离差之和始终为零。平均差:次数分布
8、中所有原始数据与平均数绝对离差的平均值2方差与标准差和方:每一个离差值平房求和 由于离差正负值互相抵消无法代表离中趋势我们引入和方的概念(1)总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数 作为样本记录量用符号s2表达,作为总体参数用符号2表达,也叫均方。标准差:方差的平方根 作为样本记录量用符号s表达,作为总体参数用符号表达。(2)样本的方差和标准差样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有助于对总体参数更好的无偏差估计:(3)性质每一个观测值都加一个相同的常数C之后,计
9、算得到的标准差等于本来的标准差每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数(4)意义方差与标准差是表达一组数据离散限度的最佳指标,它们是记录描述与记录推断分析中最常用的差异量数,它们的优点有:反映灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简朴明了3变异系数当碰到下列情况时,不能用绝对差异量来比较不同样本的离散限度,而应当使用相对差异量数,最常用的就是差异系数。两个或两个以上样本所使用的观测工具不同,所测的特质相同两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大差异系数:一种最常用的相对差异量,为标准差对平均数的比例(
10、四)相对量数1百分位数百分位数:在整个分布中,在某一值之下或等于该值的分数的比例,所相应的分数 百分位数和百分等级是同一操作定义的两端。当我们求累计次数占总体的比例是,所相应的分数和比例的值分 别为百分位数和百分等级。2百分等级百分等级:常模团队中低于该分数的人所占总体的比例 百分等级一定要相应分数区间的精确上限。百分等级和百分位数都可以由已知数据用差值法求解。3标准分数(1)定义标准分数:以标准差为单位表达一个原始分数在团队中所处位置的相对位置量数,也叫Z分数 离平均数有多远,即表达原始分数在平均数以上或以下几个标准差的位置。(2)性质Z分数无实际单位,是以平均数为参照点,以标准差为单位的一
11、个相对量一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零原始数据的Z分数的标准差为1若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布(3)优点可比性不同性质的成绩,一经转换为标准分数,就可在同一背景下比较可加性不同性质的原始数据具有相同的参照点,因此可相加明确性知道了标准分数,运用分布寒暑表就能知道其百分等级稳定性转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重同样(4)应用比较几个分属性质不同的观测值在各自数据分布中相对位置的高低计算不同质的观测值得总合或平均值,以表达在团队中的相对位置若标准分数中有小数、负数等不易被人接
12、受的问题,可通过 Z=aZ+b 的线性公式将其转化成新的分数(如韦氏成人智力量表)(五)相关量数由于实验法合用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系。相关研究所得到的是一种描述记录,我们仅仅能用其描述两个变量互相跟随的限度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论。相关系数:两列变量间相关限度的数字表现形式 作为样本的记录量用r表达,作为总体参数一般用表达。 正相关:两列变量变动方向相同 负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动 零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化1
13、积差相关也就是Pearson相关。(1)前提数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子互相独立两列变量各自总体的分布都是正态的,至少接近正态两个相关的变量是连续变量,也即两列数据都是测量数据两列变量之间的关系应是直线性的(2)公式r也就等于X和Y共同变化的限度除以X和Y各自变化的限度。2等级相关也就是Spearman相关(1)合用范围当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据当研究考察的变量为非线性数据时(2)公式将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可。3肯德尔等级相关(1)肯德尔W系数也叫肯德尔
14、和谐系数,原始数据资料的获得一般采用等级评估法,即让K个被试对N件实物进行等级评估。其原理是评价者评价的一致性除以最大变异也许性。Ri代表评价对象获得的K个等级之和N代表等级评估的对象的树木K代表等级评估者的数目(2)肯德尔U系数#其与肯德尔W系数所解决的问题相同,但评价者采用对偶比较法,即将N件事物两两配对分别进行比较rij为对偶比较登记表中ij格中的择优分数4点二列相关与二列相关(1)点二列相关合用于一列数据为等距正态变量,另一列为离散型二分变量。是与二分称名变量的一个值相应的连续变量的平均数是与二分称名变量的另一个值相应的连续变量的平均数p与q是二分称名变量两个值各自所占的比率st是连续
15、变量的标准差(2)二列相关合用于两列变量都是正态等距变量,但其中一列变量被人为地提成两类。y为标准正态曲线中p值相应的高度,查正态分布表能得到5相关合用于两个变量都是只有两个点值或只表达某些质的属性。其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据二、推断记录推论记录就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总体。进行推论记录的关键在于所抽取的样本要可以尽量接近所要研究的总体。(一)推断记录的数学基础1概率概率:表白随即时间出现也许性大小的客观指标 概率的定义包含以下两种,当观测次数够多时他们是相等的。 后验概率:对随机事件进行n次观测,某一事件A出现的次
16、数m与观测次数n的比值在n趋近无穷时所稳定在的常数p 先验概率:在满足实验也许结果数有限且每一种结果出现的也许性相等的条件下,随机事件包含的结果数除以结果总数2正态分布当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线,因此有“上帝偏爱正态分布”一说。(1)特点正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数事实上相应于同一个数值大部分的原始分数都集中分布在均值附近,极端值相对而言比较少曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交正态分布曲线转化为z分数后人以z分数与零点相应曲线下面积固定(2)用法依据Z分数求概率,即已知标准分数求面积从概率求Z分数,即从面积求标
17、准分数值已知概率或Z值,求概率密度,即正态曲线的高3二项分布二项分布:对于一个事件有两种也许A和B,但我们对这一事件观测n次,事件A发生的总次数的概率分布就是二项分布 二项分布的均值为 方差公式为 标准差的公式为4抽样原理与抽样方法(1)抽样原理抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相称大的也许使样本保持和总体有相同的结构,或者说,具有最大的也许使总体的某些特性在样本中得以发现,从而保证由样本推论总体。(2)抽样方法简朴随机取样法系统随机取样法分层随机取样法多段随机取样法5抽样分布样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 统计 心理 学学 笔记
限制150内