《现代心理与教育统计学课后题完整版.pdf》由会员分享,可在线阅读,更多相关《现代心理与教育统计学课后题完整版.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f 表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P 表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做
2、特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学?学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。3.选用统计方法有哪几个步骤?首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的
3、其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性有规律变化的变量5.怎样理解总体、样本与个体?总体 N :据有某种特征的一类事物的全体,又称为母体、样本空间,常用N 表示,其构成的基本单元为个体。特点:大小随研究问题而变(有、无限)总体性质由组成的个体性质而定样本 n:从总体中抽取的一部分交个体,称为
4、总体的一个样本。样本数目用n 表示,又叫样本容量。特点:样本容量越大,对总体的代表性越强样本不同,统计方法不同总体与样本可以相互转化。个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点6.统计量与参数之间有何区别和关系?参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数 =总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值7.试举例说明各种数据类型之间的区别?8.下述一些数据,哪些是
5、测量数据?哪些是计数数据?其数值意味着什么?17.0 千克 89.85厘米 199.2 秒 93.5 分是测量数据17 人 25 本是计数数据9.说明下面符号代表的意义反映总体集中情况的统计指标,即总体平均数或期望值X反映样本平均数 表示某一事物两个特性总体之间关系的统计指标,相关系数r 样本相关系数反映总体分散情况的统计指标标准差s 样本标准差表示两个特性中体之间数量关系的回归系数第三章集中量数1.应用算术平均数表示集中趋势要注意什么问题?应用算术平均数必须遵循以下几个原则:同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。平均数与个体数据相结合的原则
6、平均数与标准差、方差相结合原则2.中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料?中数适用于: 当一组观测结果中出现两个极端数目时 次数分布表两端数据或个别数据不清楚时 要快速估计一组数据代表值时众数适用于: 要快速且粗略的求一组数据代表值时数据不同质时, 表示典型情况次数分布中有两极端的数目时粗略估计次数分布的形态时,用M-Mo作为表示次数分布是否偏态的指标(正态:M=Md=Mo ; 正偏: MMdMo; 负偏: MMdMo)当次数分布中出现双众数时几何平均数适用于少数数据偏大或偏小,数据的分布成偏态等距、等比量表实验平均增长率,按一定比例变化时调和平均数适用于工作量固
7、定,记录各被试完成相同工作所用时间学习时间一定, 记录一定时间内各被试完成的工作量3.对于下列数据,使用何种集中量数表示集中趋势其代表性更好?并计算它们的值。 4 5 6 6 7 29 中数 =6 3 4 5 5 7 5 众数 =5 2 3 5 6 7 8 9 平均数 =5.71 4.求下列四个年级的总平均成绩。年级一二三四x90.5 91 92 94 n 236 318 215 200 解:iiTin X90.5236913189221594200X91.72n2363182152005.三个不同被试对某词的联想速度如下表,求平均联想速度被试联想词数时间(分)词数 / 分( Xi )A 13
8、 2 13/2 B 13 3 13/3 C 13 25 - 解: C 被试联想时间25 分钟为异常数据,删除Hi11M5.211123()NX2 1313调和平均数6.下面是某校几年来毕业生的人数,问平均增加率是多少?并估计10 年后的毕业人数有多少。年份1978 1979 1980 1981 1982 1983 1984 1985 毕业人数542 601 750 760 810 930 1050 1120 解:用几何平均数变式计算:N7N-11X1120Mg=1.10925X542所以平均增加率为11% 10 年后毕业人数为11201.1092510=3159人第四章差异量数1.度量离中趋势
9、的差异量数有哪些?为什么要度量离中趋势?度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。因此只有集中量数不可能真实的反映出样本的分布情况。为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。2.各种差异量数各有什么特点?见课本 103 页“各种差异量数优缺点比较”3.标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?可以计算差异
10、系数(应用)和标准分数(应用)4.应用标准分数求不同质的数据总和时应注意什么问题?要求不同质的数据的次数分布为正态5.计算下列数据的标准差与平均差11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7 10.5 Xi11.013.010.09.011.512.213.19.710.5X11.1N9Xi-X10.7A.D.=1.19n96.7.今有一画线实验, 标准线分别为5cm和 10cm, 实验结果5cm组的误差平均数为1.3cm, 标准差为 0.7cm,10cm 组的误差平均数为4.3cm,标准差为1.2cm,请问用什么方法比较其离散程度的大小?并具体比较之。用差异系数
11、来比较离散程度。CV1=(s1/1X) 100%= (0.7/1.3)100%=53.85%CV2=(s2/2X) 100% =(1.2/4.3) 100%=27.91%CV1 所以标准线为5cm的离散程度大。8.求下表所列各班成绩的总标准差班级平均数标准差人数di 1 90.5 6.2 40 0.3 2 91.0 6.5 51 -0.2 3 92.0 5.8 48 -1.2 4 89.5 5.2 43 1.3 iN40514843182iiTiN X90.54091.05192.04889.54316525.5X90.80N182182TiidXX其值见上表22222iiN s40 6.25
12、1 6.548 5.843 5.26469.7922222iiN d40 0.351 ( 0.2)48 ( 1.2)43 1.3147.4322iiiiTiN sN d6469.79147.43s6.03N182即各班成绩的总标准差是6.03 第五章相关关系1.解释相关系数时应注意什么?(1)相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数r 和总体系数(2)它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r大比 r小相关密切,不能说r大=0.8 是 r小=0.4 的两倍(不能用倍数关系来解释)(3)当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变
13、量的值(4)-1 r 1,正负号表示相关方向,值大小表示相关程度;(0 为无相关, 1 为完全正相关, -1 为完全负相关)(5)相关系数大的事物间不一定有因果关系(6)当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象(7)计算相关要成对数据,即每个个体有两个观测值,不能随便2 个个体计算(8)非线性相关的用r 得可能性小,但并不能说不密切2.假设两变量为线性关系,计算下列各情况的相关时,应用什么方法?(1)两列变量是等距或等比的数据且均为正态分布(积差相关)(2)两列变量是等距或等比的数据且不为正态分布(等级相关)(3)一变量为正态等距变量,另一列变量也为正态变量,但
14、人为分为两类(二列相关)(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关)(5)一变量为正态等距变量,另一列变量为二分称名变量(点二列相关)(6)两变量均以等级表示(等级相关、交错系数、相容系数)3.如何区分点二列相关与二列相关?主要区别在于二分变量是否为正态。二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。4.品质相关有哪几种?各种品质相关的应用条件是什么?品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类:(1)四分相关,应用条件
15、是:两因素都为正态连续变量(eg. 学习能力,身体状态) )人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况(2)系数:除四分相关外的22 表(最常用)(3)列联表相关C:RC表的计数资料分析相关程度5.预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?等级相关6.下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?被试A B A2B2AB RARBRA RBD=RA-RBD21 86 83 7396 6889 7138 2 3 6 -1 1 2 58 52 3364 2704
16、 3016 7 8 56 -1 1 3 79 89 6241 7921 7031 4 1 4 3 9 4 64 78 4096 6084 4992 6 4 24 2 4 5 91 85 8281 7225 7735 1 2 2 -1 1 6 48 68 2304 4624 3264 9 6 54 3 9 7 55 47 3025 2209 2585 8 9 72 -1 1 8 82 76 6724 5776 6232 3 5 15 -2 4 9 32 25 1024 625 800 10 10 100 0 0 10 75 56 5625 3136 4200 5 7 35 -2 4 670 65
17、9 48080 47193 46993 55 55 368 34 222222NXYXY1046993670659r=0.82NX(X)NY(Y)10480806701047193659?2R226D6 34r110.794N(N -1)10 (101)或XYR4R R334 368r(N+1)110.794N-1N(N+1)9110用积差相关的条件成立,故用积差相关更精确7.下列两列变量为非正态,选用恰当的方法计算相关本题应用等级相关法计算,且含有相同等级X 有 3 个数据的等级相同,等级3.5 的数据中有2 个数据的等级相同,等级为6.5 和 8.5 的数据中也分别有 2 个数据相同; Y
18、 有 3 个数据等级相同,等级为3 的数据中有3 个数据等级相同,等级为5.5 的数据中有 2 个数据等级相同,等级为9 的数据中有 3 个数据等级相同。被试X Y RXRYD=RX-RYD21 13 14 1 1 0 0 2 12 11 2 3 -1 1 3 10 11 3.5 3 0.5 0.25 4 10 11 3.5 3 0.5 0.25 5 8 7 5 5.5 -0.5 0.25 6 6 7 6.5 5.5 1 1 7 6 5 6.5 7 -0.5 0.25 8 5 4 8.5 9 -0.5 0.25 9 5 4 8.5 9 -0.5 0.25 10 2 4 10 9 1 1 N=1
19、0 4.5 2222Xn(n -1)2(21)2(21)2(21)C1.5121212122222Yn(n -1)3(31)2(21)3(31)C4.512121212332XNN1010 xC1.5811212332YNN1010yC4.5781212222RC22xyD81784.5r0.9722 81782xy?8.问下表中成绩与性别是否相关?被试性别成绩男成绩女成绩成绩的平方1 男83 83 6889 2 女91 91 8281 3 女95 95 9025 4 男84 84 7056 5 女89 89 7921 6 男87 87 7569 7 男86 86 7396 8 男85 85
20、7225 9 女88 88 7744 10 女92 92 8464 880 425 455 77570 适用点二列相关计算法。p 为男生成绩, q 为女生成绩,pX为男生的平均成绩,qX为女生的平均成绩,ts为所有学生成绩的标准差从表中可以计算得:p=0.5 q=0.5 p425X855q455X915222tXX77570880s()()3.6NN1010pqpbtXX8591rpq0.5 0.50.83s3.6?相关系数为 -0.83 ,相关较高9.第 8 题的性别若是改为另一成绩A()正态分布的及格、不及格两类,且知1、 3、5、7、9 被试的成绩 A 为及格, 2、4、6、8、10被试
21、的成绩A为不及格,请选用适当的方法计算相关,并解释之。被试成绩 A 成绩 B 及格成绩不及格成绩成绩的平方1 及格83 83 6889 2 不及格91 91 8281 3 及格95 95 9025 4 不及格84 84 7056 5 及格89 89 7921 6 不及格87 87 7569 7 及格86 86 7396 8 不及格85 85 7225 9 及格88 88 7744 10 不及格92 92 8464 880 441 439 77570 适用二列相关。ts和tX分别为成绩 B 的标准差和平均数,pX和qX分别是成绩A 及格和不及格时成绩B的平均数, p 为成绩 A及格的比率, y
22、为标准正态曲线中p 值对应的高度222tXX77570880s()()3.6NN1010t880X8810p441X88.25q439X87.85p=0.5查正态表得y=0.39894所以pqbtXXpq88.2 87.80.5 0.5r0.070sy3.60.39894?或者ptbtXXp88.2880.5r0.070sy3.60.39894?相关不大10.下表是某新编测验的分数与教师的评价等级,请问测验成绩与教师的评定间是否有一致性?0.871 11.下表是9 名被试评价10 名著名的天文学家的等级评定结果,问这9 名被试的等级评定是否具有一致性?被评价者被试RiRi21 2 3 4 5
23、6 7 8 9 A 1 1 1 1 1 1 1 1 1 9 81 B 2 4 3 3 9 4 3 3 2 33 1089 C 4 2 4 4 2 9 5 5 8 43 1849 D 3 5 5 5 5 2 10 7 4 46 2116 E 9 6 2 2 6 5 2 6 9 47 2209 F 6 7 8 6 3 6 6 4 6 52 2704 G 5 3 9 10 4 7 9 8 3 58 3364 H 8 10 6 8 8 3 7 10 7 67 4489 I 7 8 10 7 10 10 8 2 5 67 4489 J 10 9 7 9 7 8 4 9 10 73 5329 495 27
24、719 适用肯德尔W系数。22i2i(R )495s=R277193216.5N102323s3216.5W=0.48111K N(N -N)9(10 -10)1212即存在一定关系但不完全一致12.将 11 题的结果转化为对偶比较结果,并计算肯德尔一致性系数A B C D E F G H I J A 9 9 9 9 9 9 9 9 9 B 0 7 7 5 8 7 7 8 8 C 0 2 6 5 6 7 7 7 7 D 0 2 3 5 6 5 8 7 8 E 0 4 4 4 5 5 6 6 9 F 0 1 3 3 4 6 7 7 7 G 0 2 2 4 4 3 5 6 6 H 0 2 2 1
25、3 2 4 4 5 I 0 1 2 2 3 2 3 5 5 J 0 1 2 1 0 2 3 4 4 已知 N=10 ,K=9 选择对角线以下的择优分数2ijr294ijr942ijij8(rKr )8(2949 94)U110.319N(N-1)K(K-1)10(10-1) 9(9-1)?或者选择对角线上的择优分数2ij()r2247上ijr311(上)2ijij()8(rKr)8(22479 311)U110.319N(N-1)K(K-1)10(10-1) 9(9-1)?上(上)第六章概率分布3、 何谓样本平均数的分布所谓样本平均数的分布是指从基本随机变量为正态分布的总体(又称母总体)中,采
26、用有放回随机抽样方法,每次从这个总体中抽取大小为n 的一个样本, 计算出它的平均数1X, 然后将这些个体放回去,再次取 n 个个体,又可计算出一个2X,再将n 个个体放回去,再抽取n 个个体,这样如此反复,可计算出无限多个X,理论及实验证明这无限多个平均数的分布为正态分布。10、查正态表求:(1)Z=1.5 以上的概率 0.5-0.43319=0.06681 (2)Z=-1.5 以下的概率 0.5-0.43319=0.06681 (3)Z=1.5 之间的概率 0.433192= (4)P=0.78 Z=? Y=? Z=0.77 Y=0.29659 (5)P=0.23 Z=? Y=? Z=-0.
27、74 Y=0.30339 (6)Z为 1.85 至 2.10 之间的概率? 0.48214-0.46784=0.0143 13、今有 1000 人通过一数学能力测验,欲评为六个等级,问各个等级评定人数应是多少?解: 6 6=1,要使各等级等距,每一等级应占1 个标准差的距离,确定各等级的Z 分数界限,查表计算如下:分组各组界限比率 p 人数分布pN 1 2以上0.02275 23 2 120.13591 136 3 010.34134 341 4 -1 0 0.34134 341 5 -2 -1 0.13591 136 6 -2以下0.02275 23 24、已知一正态总体=10, =2。今随机取n=9的样本,X12,求 Z 值,及大于该Z 以上的概率是多少?解:属于样本分布中总体正态,方差已知的情况:X =,X =n,所以XXX12Z39102/,查表得 Z=3时 p=0.49865 ,所以大于Z=3的概率是 0.5-0.49865=0.00135 26、已知212,df7,问该2以上及以下的概率是多少?解,查表得df=7 时,212以上的概率是0.100 ,以下概率为1-0.100=0.900 第八章8、9、10、11、12、第九章6、第 10 章6、10、12、14、第 12 章4、5、
限制150内