现代心理与教育统计学复习资料1.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《现代心理与教育统计学复习资料1.docx》由会员分享,可在线阅读,更多相关《现代心理与教育统计学复习资料1.docx(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章 心理及教化统计学根底学问1, 数据类型 称名数据 计数数据 离散型数据 依次数据 等距数据测量数据 连续型数据 比率数据2, 变量, 随机变量, 观测值变量是可以取不同值的量。统计视察的指标都是具有变异的指标。当我们用一个量表示这个指标的视察结果时,这个指标是一个变量。用来表示随机现象的变量,称为随机变量。一般用大写的或表示随机变量。随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。, 总体, 个体和样本须要探讨的同质对象的全体,称为总体。 每一个具体探讨对象,称为一个个体。从总体中抽出的用以推想总体的局部对象的集合称为样本。样本中包含的个体数,称为样本的容量n。一般把容
2、量n 30的样本称为大样本;而n 30的样本称为小样本。, 统计量和参数统计指标统计量参数平均数标准差S相关系数r回来系数b5, 统计误差误差是测得值及真值之间的差值。测得值真值误差统计误差归纳起来可分为两类:测量误差及抽样误差。 由于运用的仪器, 测量方法, 读数方法等问题造成的测得值及真值之间的误差,称为测量误差。由于随机抽样造成的样本统计量及总体参数间的差异,称为抽样误差第二章 统计图表一, 数据的整理在进展整理时,假如没有足够的理由证明某数据是由试验中的过失造成的,就不能轻易将其解除。对于个别极端数据是否该剔除,应遵循三个标准差法那么。 二、 次数分布表一简洁次频数分布表二相对次数分布
3、表将次数分布表中各组的实际次数转化为相对次数,即用频数比率fN或百分比 来表示次数,就可以制成相对次数分布表三累加次数分布表四双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理实力的分数或两种心理特点的指标,或同一组被试在两种试验条件下获得的结果。 三, 次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布状况和变动趋势作粗略的分析。简洁次频数分布图直方图, 次数多边形图累加次数分布图累加直方图, 累加曲线一简洁次数分布图直方图二简洁次数分布图次数多边图次数分布多边形图 是一种表示
4、连续性随机变量次数分布的线形图,属于次数分布图。但凡等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。三累加次数分布图累加直方图四累加次数分布图累加曲线四, 其他统计图表条形图:用直条的长短来表示统计工程数值大小的图形,主要是用来比拟性质相像的连续型资料。 圆形图:是用于表示连续型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成局部所占的比例。各局部的比例一般用百分比表示。线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变更的状况;某种
5、事物随时间推移的开展趋势等。基于线形图,既可对有关统计变量进展数量比拟,又可分析开展的趋势。 散点图是用一样大小圆点的多少或梳密表示统计资料量大小以及变更趋势的图。第三章 集中量数集中量数用来表现数据资料的典型水平或集中趋势 。 常用的集中量包括算术平均数, 加权平均数, 中位数和众数等等。 一, 算术平均数算术平均数 一般简称为平均数或均数, 均值。一般用,或者用表示。算术平均数是最常用的集中量一算术平均数的计算公式 二算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值 的最正确估计值。真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。在实
6、际测量中,往往接受“屡次测量,取平均数的方法,用平均数去估计真值。三算术平均数的优缺点 优点:反响灵敏, 有公式严密确定, 简明易懂, 适合代数运算缺点:简洁受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。四计算和应用算术平均数的原那么同质性原那么:算术平均数只能用于表示同类数据的集中趋势。平均数及个体数值相结合的原那么:在说明个体特征时,既要看平均数,也要结合个体的数据。平均数及标准差, 方差相结合原那么:描述一组数据时既要分析其集中趋势,也要分析离散程度。二, 中位数中位数又称为中数,是按依次排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用或表示一中位数的计算方
7、法1, 原始数据计算法一组数据中无重复数值的状况首先将一组数据按依次排列 ;2, 次数分布表计算法公式中为中位数所在组的精确下限 为中位数所在组下限以下的累积频数 n为数据总和 为中位数所在组的频数 i为组距二中位数的特点及应用中位数是依据全部数据的个数来确定其位置的,意义简明,对按依次排列的数据来讲,计算中位数也比拟简洁。中位数不受两端极端数据的影响,但反响不灵敏,也不适合进一步代数运算的要求。一般用于以下状况:1, 一组数据中有极端数据时;2, 一组数据中有个别数据不精确, 不清楚时;3, 资料属于等级性质时。三众数众数用表示,有两种定义:理论众数是指及频数分布曲线最高点相对应的横坐标上的
8、一点;粗略众数是一组数据中出现次数最多的那个数。众数也是一种集中量,也可用来表示一组数据的集中趋势。众数的计算方法视察法找寻粗略众数 未分组数据中出现次数最多的数即为众数。次数分布表中,频数最多那一组数据的组中值,即为众数。四, 算术平均数, 中位数, 众数三者的关系在正态分布中:在正偏态分布中:在负偏态分布中:五, 其它集中量数一加权平均数加权平均数是不同比重数据或平均数的平均数,一般用 表示。其计算公式有两种: 二几何平均数几何平均数 是n个数值连乘积的n次方根,用或表示。计算公式为:当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。几何平均数的变式 两边取对数,得留意:几何平均
9、数计算的是平均的变更状况,假如要计算平均增长率,须要从几何平均数中减去基数1。几何平均数的应用:有少数极端数据,数据呈偏态分布;心理物理学中的等距及等比量表试验中.例3-8P72按确定比例变更的一列数据,一般用来求平均变更率如平均增长率.例3-93-103-11P73三调和平均数调和平均数( ),用符号表示.也叫倒数平均数.公式为:调和平均数的应用学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他集中量在有关探讨学习速度的试验设计中,反响指标一般常取两种形式;1, 工作量固定,记录各被试完成一样工作所用的时间.例3-133-14P762, 学习时间确定,记录确定时间内各被试完成
10、的工作量,例3-15第四章 差异量数 描述数据离散程度的统计量称为差异量。差异量越大,说明数据越分散, 不集中;差异量越小,说明数据越集中,变动范围越小。 一组数据的离散程度,常常通过数据的离中趋势特点进展分析。一, 全距, 四分位距和百分位距一全距 R 全距是一组数据中的最大值及该组数据中最小值之差,又称极差。R二百分位差百分位距 百分位差是指两个百分位数之差。常用的百分位距有两种:用几个百分位距能较好地反映一组数据的差异程度。 对于任何一组视察值,只要随意指定一个位置,就可以求出这个位置的数应当是多少;百分位数相反,假如给出一个数,也可以求出它应当在哪个位置百分等级百分位数频数分布中相对于
11、某个特定百分点的原始分数,它说明在分布中低于该分数的个案占总频数的百分比。 百分等级分数频数分布中低于特定原始分数的频数百分比。三四分位距四分位距是第一个四分位数及第三个四分位数之差的一半,计算公式为四平均差平均差 或者 是指一组数据中,每一个数据及该组数据的平均数离差的确定值的算术平均数,通常用或表示。原始数据计算公式五方差和标准差方差又称为变异数, 均方。是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。标准差 是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差用 表示。标准差和方差是描述数据离散程度的最常用的差异量。1, 样本方差及标准差定义公式
12、2, 总体方差及标准差的定义公式 是总体的无偏估计3, 原始数据的方差及标准差计算4, 总标准差的合成 方差具有可加性的特点。当几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。须要留意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。计算公式 公式中: 为总方差, 为总标准差 为各小组标准差 为各小组数据个数 5, 方差和标准差的性质方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。标准差是一组数据方差的算术平方根,它不行以进展代数计算,但有以下特性:假如 那么假如 那么6, 方差和标准差的意义方差及
13、标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。标准差具备一个良好的差异量应具备的条件,如:反响灵敏,有公式严密确定,简明易懂,适合代数运算等等。应用方差和标准差表示一组数据的离散程度,须留意必需是同一类数据即同一种测量工具的测量结果,而且被比拟样本的水平比拟接近。7, 标准差的应用/差异系数差异系数 是指标准差及其算术平均数的百分比,它是没有单位的相对数。常以表示,其计算公式为 :差异系数的作用: 比拟不同单位资料的差异程度 比拟单位一样而平均数相差较大的两组资料的差异程度可推断特别差异状况 8, 标准差的应用标准分数又称基分数或Z分数,是以标准差为单位表示一个原始分数在
14、团体中所处位置的相对位置量数。离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。标准分数从分数对平均数的相对地位, 该组分数的离中趋势两个方面来表示原始分数的地位。 1标准分数的计算公式及其性质没有实际单位;可正可负,可为零;一组原始数据中,各个Z分数的标准差为1;正态分布的原始数据,转换得到的Z分数是标准的正态分布0,1。2Z分数的作用分数可以说明原始分数在团体中的相对位置,因此称为相对位置量数。把原始分数转换成分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位, 以平均数为参照点的分数。3标准分数的优点l 可比性:标准分
15、数以团体的平均数为基准,以标准差为单位,因而具有可比性。l 可加性:标准分数使不同的原始分数具有一样的参照点,因而具有可加性。l 明确性:标准分数较原始分数的意义更为明确。l 合理性:标准分数保证了不同性质的分数在总分数中的权重一样,使分数更合理地 反映事实。第五章 相关分析 一, 相关概述 一相关的概念 两个变量之间不精确, 不稳定的变更关系,称为相关关系。两个变量之间的变更关系,既表现在变更方向上,又表现在密切程度上。两个变量之间的变更方向有: 正相关:两个变量的变更方向一样。 负相关:两个变量的变更方向相反。 零相关:两个变量的变更方向无确定规律。从关系密切程度来看,两个变量的变更程度可
16、大致分为 完全相关:两个变量的变更程度完全一样。 强相关:两个变量变更的一样性比拟强。 中等相关:两个变量变更的一样程度中等。 弱相关:两个变量变更的一样性比拟差。 完全不相关:两个变量变更程度没有一样性。二相关系数用来描述两个变量相互之间变更方向及密切程度的统计指标称为相关系数,一般样本的相关系数用r表示,总体的相关系数用表示。 相关系数的取值: -1 r +1 0r1 相关系数的符号:“表示正相关,“表示负相关。相关系数的性质相关系数不是由相等单位度量而来的,因此只能比拟大小,不能做任何加, 减, 乘, 除运算。二, 积差相关一积差相关及其适用条件积差相关是英国统计学家皮尔逊于20世纪初提
17、出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关 。积差相关适用于:1, 两个变量都是连续数据;两变量总体都为正态分布;两变量之间为线性关系。2, 成对数据,样本容量要大。积差相关条件的推断方法:连续变量:依据得到数据的方式推断,测量数据。正态分布:一般状况下,正常人群的身高, 体重, 智力水平, 心理及教化测验的结果,都可按总体正态分布对待;假如要求比拟高,那么须要对数据进展正态性检验。线性关系:依据相关散布图可推断两个变量之间是否线性关系。二相关系数的等距转换及其合并相关系数不是等距数据,更不是比率数据,它只能比拟相对大小,不能进展加减乘除运算。但我们常会遇到须要将取自同一
18、总体的几个样本的相关系数合成, 求平均的相关系数这一问题。这时,可以先将相关系数r转换成具有等距单位的值。三, 斯皮尔曼等级相关等级相关 是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数 多列等级相关。 一斯皮尔曼等级相关的概念及适用条件斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量,并不要求两个变量总体呈正态分布,也不要求样本的容量必需大于30。当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。四, 肯德尔和谐系数 肯德尔等级相关方法有许多种,肯德尔和谐系数是其中一种。 肯德尔和谐系数常
19、以r表示,适用于多列等级变量的资料。 肯德尔和谐系数可以反映多个等级变量变更的一样性。肯德尔U系数及W系数的适用资料一样。五, 质及量的相关 一点二列相关适用条件一个变量为正态, 连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关,称为点二列相关 。有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。多用于评价是非类测验题目组成的测验内部一样性。 二二列相关两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关 。 将连续变量人为划分为二分变量时,应留意尽量使分界点接近平均数。教化或心理测验中问答题的区分度指标
20、。六, 品质相关两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。品质相关处理的一般是计数数据而不是连续数据,变量划分为不同的品质类别,主要用于双向表或称为列联表RC表。品质相关的方法有多种,最常用的是四分相关, 相关和列联表相关。第六章 概率分布一, 概率的定义一根本概念概率:说明随机事务可能性大小的客观指标。概率的两种定义:后验概率和先验概率。后验概率或统计概率 随机事务的频率:当n无限增大时,随机事务A的频率会稳定在一个常数P,这个常数就是随机事务A的概率。先验概率古典概率古典概率模型要求满足两个条件: 试验的全部可能结果是有限的; 每一种可能结果出现的可能性相等。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 心理 教育 统计学 复习资料
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内