现代心理与教育统计学(48页).doc
《现代心理与教育统计学(48页).doc》由会员分享,可在线阅读,更多相关《现代心理与教育统计学(48页).doc(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-现代心理与教育统计学-第 47 页心理统计学第一章概述描述统计 定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理 概 括和表述 作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。 具体内容:1数据分组:采用图与表的形式。 2计算数据的特征值:集中量数(平均数 中数) 离散量数(方差) 3计算量事物间的相关关系:积差相关(2列 3列 多列)推断统计 定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理 论和方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各
2、种非参数的统计方法。 心理与教育统计基础概念数据类型一 从数据来源来划分 1计数数据:计算个数或次数而获得的数据。(都是离散数据) 2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据)二根据数据所反映的测量水平1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类的数据。 特点:数字只是事物的符号,而没有任何数量意义。 统计方法:百分数 次数 众数 列联相关 卡方检验等。(非参检验)2顺序数据(分类 排序) 定义:指代事物类别,能够表明不同食物的大小 等级或事物具有的某种特征的程度的数 据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征的真正数量。 统计方法:中位
3、数 百分位数 等级相关 肯德尔和谐系数以及常规的非参数检验方法。3等距数据(分类 排序 加减(相等单位)(真正应用最广泛的数据) 定义:不仅能够指代物体的类别 等级,而且具有相等的单位的数据。(成绩 温度) 特点:真正的数量,能进行加减运算,没有绝对零点 ,不能进行乘除计算。 统计方法:平均数 标准差 积差相关 Z检验 t检验 F检验等。4比率数据(分类 排序 加减法 乘除法(绝对零点) 定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正的数字,有绝对零点,可以进行加减乘除运算。 在统计中处理的数据大多是顺序数据和等距数据。三 按照数据是否具有连续性 离散数据 连
4、续数据变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“x”表示,即为一 个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。 观测值:是研究中确定的某一变量的取值。 随机变量:表示随机现象各种结果的变量称为随机变量三 总体 样本 个体 总体 :具有某种共同特质的一类事物。(欲研究的研究范围) 样本 :构成总体的每个基本单元。 个体:从总体重抽取的部分个体组成的群体。样本容量超过30为大样本反之为小样本。四 次数比率频率与概率 次数:某一事件在某一类别中的数目。 比率:(比例 百分数)两个数相比。 频率:(相对次数)某一事件发生的次数被总的事件
5、数目出。常用比例 百分数表示。 概率:用符号P表示,指某一事件在无限观测中所能预料的相对出现的次数。五统计量和参数 1参数:(总体参数)描述一个总体情况的统计指标用希腊字母表示。(小写)(大写 表示运算符) 总体平均数 总体标准差 总体相关系数 总体回归系数2统计量:(特征值 样本统计量)描述一组数据的情况。 样本统计量用英文表示 样本平均数 样本标准差 样本相关系数 样本回归系数小结 描述统计 心理与教育统计学内容 推论统计 实验设计 计数数据 测量数据 数据类型 称名数据 顺序数据 等距数据 比率数据 离散数据 计数数据 变量 观测值 随机变量 心理与教育统计基础概念 总体 样本 个体 次
6、数 频数 概率 参数 统计量练习题1等距量表的特点是()A 无绝对零点,无相同单位。B 无绝对零点,有相同单位。C 有绝对零点,无相同单位。D 有绝对零点,有相同单位。2下列量表中具有绝对零点的是()A 称名量表B 顺序量表C 等距量表D 比率量表3教师的职称和薪水这两个变量的数据类型分别属于()A 命名数据 等比数据B 等距数据 等比数据C 顺序数据 等距数据D 顺序数据 等比数据4下列数据类型属于比率数据的是()A 智商分数B 反应时C 年纪D 数学成绩练习题思路解析1 B 见第一页2 D 见第一页3 D 职称:讲师 副教授 教授 这三个职称能排序,但不能做加减法。(顺序数据) 薪水: x
7、 y z 能排序能做加减法,也具有绝对零点(没工资)能做乘除法。 (比率数据) 4 B 智商分数:加减法可做不能做乘除(智商测量表测量出来人为规定零)(等距数据) 反应时:有绝对零点(比率数据) 年级:只能大小排序(顺序数据) 数学成绩:人为规定零点(等距数据)第二章统计图表(重要但不怎么考)(图表的特点)第一节 数据的初步整理(将数据制成统计图表的第一步) 一 数据排序 排序就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行排列。数据排序是正理数据最简单的方法。 二 统计分组统计分组只根据被研究对象的特征,将所得到的数据划分到各个分组中去。 数据的取舍原则:三个标准差原则 三
8、统计表统计表:用来表达统计指标与被说明的事物间关系的表格。 特点:简洁 清晰 准确 表中数据易于比较分析。 三线表 四 统计图 统计图:用来表达统计指标与被说明事物之间数量关系的图形,是统计数据资料的可 视化显示方式。第二节 次数分布表(最重要的一类统计表)(皮尔逊 次数分布表 次数分布图) 一 简单次数分布表(既可用于计数数据的整理,又可用于测量数据的整理)简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统 计表。特点:对数据资料的来源没有过多要求,编制过程简单,应用广泛。 二 分组次数分布表当数据的取值过多时,不适合每个值记录一个频次。把所有数据先划分为若干个分组
9、区间,然后将数据按其数值大小划归相应组内,分别计算各个组别中的数据个数,再用列表的形式呈现出来,就构成了分组次数分布表。制作过程:1 求全距(离散量度) 全距=最大值-最小值(离散2 决定组数组数 (N为数据个数,K取近似整数)(经验公式)3 决定组距(任意一组的起点和终点之间的距离) 组距是一个组的上限与下限之差 组距=全距/组数4 列出分组区间(组限)(一个组起点值与终点值之间的距离) 组上限:一个组的终止点 组下限:一个组的起始点 表示方法: 表述组限:10-19 20-29 30-39分组次数分布表的意义与缺点 意义:显示数据的分布状况,集中状况。 假设:各区间的数据均匀分布,并用各组
10、的组中值代表各原始数据。 缺点:由于假设所造成的误差为归组效应。三 相对次数分布表 1 含义:相对次数是指各组次数f对数据总个数N的比值,用符号f/N表示。 所有相对次数之和 f/N等于1. 2 制作:将分组次数分布表的各组次数转化为相对次数,用f/N或f/N100%作标 志来表示次数就制成了相对次数分布表。 四 累加次数分布表 1 实际累加次数 把各组次数f由下而上或由上而下依次累加的和,用符号cf表示。 2 相对累加次数 把各组的相对次数p由上而下或由下而上依次累加的和,累加之和为1. 五 双列次数分布表(相关次数分布表) 1 含义:对有联系的两列变量用一个表来表示次数分布。(体重与血压;
11、智力与成 绩) 2 制作:先按照分组次数表的编制方法,分别列出各变量的分组区间,登记时,每 次同一对变量同时登记在相应的格内。第三节 次数分布图 一 直方图(又称等距直方图,用于等距变量)用一系列宽度相等、高度不一的矩形表示数据分布的统计图。以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用数轴表示数据的等距分组点,也就是各组分组区间的上限和下限,有时也使用组中值。 二 次数多边图(变化趋势) 一种线形图,凡是等距分组的可以用直方图表示的数据,都可以用次数多边图表示。 绘制时,横坐标是用各分组区间组中值表示的连续变量,纵坐标是数据的次数。以每个分组区间的组中值为横坐标,
12、一个组的次数为纵坐标标点,连接各点,就成为一条折线。 三 累加次数分布图在累加次数分布表的基础上绘制的,有直方图式和曲线式两种,最为常用的是累加曲线图。 累加次数分布曲线 横轴:原始分数 百分位数 纵轴:等级排名 百分等级 正偏态分布:小端的数据特别多,大端的数据不是很多,比较分散,表现在曲线就是上肢 长于下肢。(分数分布在低端) 负偏态分布:大端的数据比较多,小端的数据不是很多,但比较分散,表现在曲线就是下 肢长于上肢。(分数分布在高端) 正态分布 :中端的数据最多,两端的数据少,平均两侧的数据个数差不多,表现在曲线 是上肢和下肢长度相当。(中数众数平均数三合一、曲线上拐点50%)第四节 其
13、他类型的统计图表 一 条形图表示的是离散型数据资料,宜用宽度相同的条形长短或高低来表示统计数据的大小或变动情况的统计图。一个是分类轴(横轴),表示类别,描述的是计数的数据。(离散数据(类别)一个是数量轴(纵轴),表示大小多少,描述的是计量数据。(连续数据(测量数据)条形图与直方图的本质区别(选择 简答 多选)条形图与直方图的本质区别条形图直观图 数据类型离散数据(分类)连续数据(分组区间)数据表示方式直条的长度面积 坐标轴(横轴)分类轴刻度值直观状态有间隔没有间隔 二 圆形图(饼图) 以整个圆的面积带鞭被研究对相的总体,按照组成部分占总体的比重大小,把圆面积分 成若干扇形,用来表示某一现象的部
14、分对总体的比例关系。 适用于离散性的数据。 三 线形图1 用来表示连续性资料,是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。 (考点) 2 表示的是两边两之间的函数关系或描述某种现象的发展趋势,或一种现象随着另一种 现象变化发展的情形。 3 通常用横轴表示自变量,用纵轴表示因变量。 四 散点图 1 用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。 2 还可以表示相关程度。 (正相关、负相关、无相关、可能相关)练习题1 某考生最高分为81分,在下列次数分布表中,能直接判断有多少考生得分比他低的 是() A 简单次数分布表 B 分组次数分布表 C 累加次数分布表 D 相对
15、次数分布表2 运用相对累加次数分布曲线,可以快速计算出原始分数相对应的统计量是() A 百分等级 B Z分数 C T分数 D 频次3 适用于描述某种心里属性在时间上的变化趋势的统计分析图() A 茎叶图 B箱形图 C 散点图 D 线形图4 用于描述两个变量之间相关关系的统计图() A 直方图 B 线形图 C 条形图 D 散点图 答案及解析 1 C 见第5页 2 A 3 D 见第7页 4 D前两章 没什么特别重要的知识但不要放松必拿分数。第三章集中量数(2-3选择) 数据的集中趋势就是指数据分布中大连数据朝向某个方向集中的程度,用于描述数据集中程度的统计量。第一节 算书平均数 一 概念及计算公式
16、 1概念 算术平均数,是所有观测值(或变量)的总和除以总数所得得商。 符号:或 2计算公式 公式一 (平均数的定义公式) 公式二 (平均数的估算公式) AM 估算值 例题 现有一组实验观测数据,25 27 28 27 25 29 30 34 32 33.计算他们的平均数。 解法一: 根据题意已知N=10,根据公式: 解法二: 先设定一个估计平均数AM=27,求x=Xi-A的值。 Xi 25 27 28 27 25 29 30 34 32 X -2 0 1 0 -2 2 3 7 5 先估计 平均值为27(预估计)(大的数据用估计法好算 有利于简化 计算过程) 二 平均数的特点 1 一组变量值的和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 心理 教育 统计学 48
限制150内