《考研资料》北京大学心理统计研究生考试试卷.doc
北大心理统计试卷88北京大学心理统计研究生考试试题(2000,2001,2002,2004,2005,2006)心理统计2000年试卷1.因素分析中,因素的数目确定后,常需“转轴”,转轴的根据和目的是什麽?2.采用慢性病人家属及医生的文卷中的数据用多元逐步回归分析的方法得出如下结果: Y 病人躯体功能 B ZB 1.病人神经质 -3.44 -0.90 2.医生对病人疗效预期 -2.5 -0.92 cl 56.46 f 183 * 问:A. 根据表中数据简述取得该结果的统计步鄹。B. 列出回归方程。C. 解释表格中的试验结果。 3. 当两总体确实有相关时,样本相关系数r 的样本分布是正态的吗?为什么?4在进行平均数差异的显著性检验的时候,为何要进行方差一致性检验?5当要进行三个总体以上的总体差异显著性检验时为何不宜采用两两t检验?6.卡方分布运用范围?心理统计2001年试卷一三位研究者评价人们对四种速食面品牌的喜好程度。研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。研究者乙让评定者将四种品牌分别给予1-5的likert等级评定,(1表示非常不喜欢,5表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。研究者甲,乙,丙所使用的数据类型分别是: a)类目型-顺序型-计数型 b)顺序型-等距型-类目型 c)顺序型-等距型-顺序型 d)顺序型-等比型-计数型 2. 一位教授计算了全班20个同学考试成绩的均值,中数和众数,发现大部分同学的考试成绩集中于高分段。下面哪句话不可能是正确的? a)全班65的同学的考试成绩高于均值 b)全班65的同学的考试成绩高于中数 C)全班65的同学的考试成绩高于众数 d)全班同学的考试成绩是负偏态分布 3一个N=10的总体,SS200。其高差的和(X-u)是: a)14.14 b)200 C)数据不足,无法计算 d)以上都不对 4. 方差分析中,F(2,24)0.90。F检验的结果: a)不显著 b)显著 c)查表才能确定 d)此结果是不可能的 5.在重复测量的方差分析中,在各组均值不变的情况下,如果被试间差异增加 a)会减少组间方差 b)会减少误差方差 c)会使F值降低 d)F值保持不变 6什么情况下样本均值分布是正态分布? a)总体分布是正态分布 b)样本容量在30以上 c)a)和b)同时满足 d)a)或b)之中任意一个条件满足 7以下关于假设检验的命题,哪一个是正确的? a)如果H0在 a=.05的单侧检验中被接受,那么H0在a=.05的双侧检验中一定会被 接受 b)如果t的观测值大于t的临界值,一定可以拒绝H0 C)如果H0在a=.05的水平上被拒绝,那么H0在a=.01的水平上一定会被拒绝 d)在某一次实验中,如果实验者甲用a=.05的标准,实验者乙用a=.01的标准。实 验者甲犯II类错误的概率一定会大于实验者乙。 8某内外向量表分数范围在1到10之间。随机抽取一个n25的样本,其分布接近正态分布。该样本均值的标准误应当最接近下面哪一个数值: a)0.2 b)0.5 c)l.0 d)数据不足,无法估算 9让64位大学生品尝A,B两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表): a)2.28% b)4.01% c)5.21% d)39.06% 10在多元回归的方法中,除哪种方法外,各预测源进入回归方程的次序是单纯由统 计数据 决定的: a)逐步回归 b)层次回归 c)向前法 d)后退法 二填空(每题3分,共30分) 1. 对于下列实验数据: 1,100,11,9,5,6,9,9,7,11, 描述其集中趋势用_最为适宜,其值是_。 2一个n10的样本其均值是21。在这个样本中增添了一个分数,得到的新样本均值是25。这个增添的分数值为_。 3. 一个n=7的样本,分数为8431。8432,8435,8432,8436,8433,8434。其和方SS 为_ 4. 正态分布中Z分数在-2.58至-1.65之间的区域占整个分布面积的_ 5一个总体的均值和标准基是u=100,=15。如果将这个分布转换成u=50,=20的分布,原来的120分在新的分布中应该是_分。 6一个正态总体,u=70,=20,从中随机抽取 n16的样本,得到样本均值大于75的概率是_(不查表)。 7. 一对n=6的变量X,Y的方差分别为8和18,离均差的乘积和是SP=40,变量X,Y积差相关系数是_。 8一位研究者报告3*2的方差分析中,对其中一个因素主效应F检验的结果是F(2,24)=5.92。根据此结果可知研究中有_个被试。 9. 一位研究者随机抽取了n3000的企业人员样本,发现管理素质量表分数与管理绩效指标的相关是.62。另一位研究者随机抽取了n80的银行支行经理,发现同样的管理素质量表分数与同样的管理绩效指标的相关仅为.21。你如何解释这个差异_ _。 10一位研究者用一个n25的样本得到90的置信区间是87±10。如果他需要置信区间的宽度在10或10以内,而置信度仍为90%,他至少需要的样本客量为n_。 三简答题(每题6分,共30分) 1一位研究者收集其实验的样本组成如下。对这些数据进行分类整理和概括,并用论文格式报告 性别 年级 年龄 女 3 26 女 1 22 女 3 25 女 3 26 男 1 23 女 2 23 男 1 26 女 1 22 女 1 23 女 4 25 女 1 23 女 1 22 2一位研究者用心理量表测量大学生的内外控倾向。随机抽取了一个有8位男生,8位女生的样本。男生组样本均值X=11.4,SS=26;女生组样本均值X=13.9,SS=30。对总体均值的差异作置信度为80的区间估计。 3社会学家发现儿童早期被虐待可能导致青年期的犯罪行为。选取了25个罪犯和25个大学生,询问其早期被虐待经历,结果的次数分布如下。罪犯是否比大学生有更多的早期被虐待经历? 用a.05的标准作假设检验 无早期被虐待经历 有早期被虐待经历 罪犯 9 16 大学生 19 6 4. 8位电脑专家对4种防病毒软件性能进行1-10的等距评定,(1表示非常不好,10表示非常优越)下列方差分析表总结了评估结果。填充表的值。并对假设检验做出结论。 来源 SS df MS 处理间 270 _ _ F=9 处理内 _ _ _ _ _ _ _ _ _ 总和 680 _ 5下面是对8个项目作主成分分析的旋转后因素载荷矩阵: 因素I 因素II 因素III 因素IV 项目1 .81 .05 .20 .13 项目2 .78 .21 .01 .12 项目3 .65 -.04 .11 .29 项目4 .22 .78 .09 .33 项目5 .02 .69 .36 .28 项目6 .11 .55 .22 -.20 项目7 .08 .25 .39 .19 项目8 -.13 .20 .28 .30 1)简略描述表中的结果 2)利用已知的数据,粗略绘出所给出4个因素的碎石图(Scree plot) 3)你对研究者选取因素的个数有何评论 四应用题(每题10分,共20分) 1欲考察放松训练对考试焦虑的疗效,研究者A,B,C,D的研究设计, a)研究者A先记录了所有被试的基线焦虑水平。然后所有被试接受放松训练3周。之后研究者测量了所有被试治疗后的焦虑水平 b)研究者B把被试随机分成两组,记录了所有被试的基线焦虑水平。其中一组接受放松训练3周,另一组作为控制组,未接受处理。之后研究者测量了两个组在考试情境下的焦虑水平 C)研究者C将被试随机分成两组,其中一组接受放松训练3周,另一组作为控制组,未接受处理。三周后,研究者测量了两组被试的焦虑水平 d)研究者D将被试根据他们的自尊水平和平均绩点两两匹配成被试对,然后分成两个匹配组。其中一组接受放松训练3周,另一组作为控制组,未接受处理。三周后,研究者测量了两组被试的焦虑水平 为上述研究设计提出适当的统计分析方法,并比较每种研究设计在统计分析角度的异同。 2. 一位教育学教师让每个学生报告他们用于准备考试的时间和考试时答错的题目 数: 准备考试的小时数 答错的题目数 4 5 0 12 2 3 2 3 3 1 6 4 a)计算用于准备考试的时间和考试时答错的题目数之间的积差相关系数 b)计算用于准备考试的时间和考试时答错的题目数之间的等级相关系数 c)忽略样本客量的问题,解释两种相关系数的大小为何有差异,在上述数据中,你认为哪种更准确地反映了数据的关系? 试卷附表为一张t表,一张F表,此处略过2002北京大学心理统计 一、选择 1、调查了n200个不同年龄组的被试对手表显示偏好程度 偏 好 程 度 年龄组 数字显示 钟面显示 不确定30岁或以下 90 40 1030岁以上 10 40 10该题自变量与因变量的数据类型分别是: a、类目型-顺序型 b、计数型-等比型 c、顺序型-等距型 d、顺序型-命名型 2、某个单峰分布的众数为15,均值是10,这个分布应该是 a、正态分布 b、正偏态分布 c、负偏态分布 d、无法确定 3、现有8名面试官对25名求职者的面试过程做等级评定,为了解这8位面试宫的评价一致性程度,最适宜的统计方法是求 a、spearman相关系数 b、积差相关系数 c、肯德尔和谐系数 d、点二列相关系数 4、一个单项选择有48道题,每题有四个被选项,用a=0.05单侧检验标准,至少应对多少题 成绩显 著优于单凭猜测 a、16题 b、17题 c、18题 d、19题 5、以下关于假设检验的命题哪一个是正确的 a、实验者甲用a=0.05的标准,实验者乙用a=0.01的标准,甲罕犯II类错误的 概率一定 会大于乙: b、统计效力总不会比Alpha水平小 1-b=a c、扩大样本容量犯II类错误的概率增加 d、两个总体间差异小,正确的拒绝虚无假设的机会增加。 6、一位研究者调查了n=100的大学生每周用于体育锻炼的时间和医生对其健察状况的总体 评价, 得到积差相关系数r=.43,由此可以推知以下哪个结论? a、随机抽取另外100个健康状况低于这次调查平均值的大学生,调查其每周用于体育锻 炼的时间,会得到接近r=.43的积差相关系数 b、用大学生每周用于体育锻炼的时间来预测其健康状况的评价准确率为43% c、大学生用于体育锻炼的时间长短影响其健康状况 d、以上都不对,因为不知道r=.43与r=0是否有显著差异 7、已知X和Y的相关系数r1是0.38,在0.05的水平上显著,A与B的相关系数r2是0.18,在0.05的水平上不显著 a、r1与r2在0.05水平上差异显著 b、r1与r2在统计上肯定有显著差异 c、无法推知r1与r2在统计上差异是否显著 d、r1与r2在统计上不存在显著差异 8、在回归方程中,原设其他因素保持不变,当X与Y相关趋近于0时,估计的标准误是怎样变化? a、不变 b、提高 c、降低 d、也趋近于0 9、在因素分析中,每个因素在所有变量的因素负荷的平方和成为该因素的: a、贡献率 b、共同性 c、特征值 d、公共因素方差 10、在主成分分析的方法中。哪一个不是用来决定抽取因素的数目的根据 a、碎石图 b、因素所解释的方差百分比和累计百分比 c、因素的可解释性 d、X是否达 到统计的显著性 二、填空 1、对于下列样本l、4、3、6、2、7、18、3、7、2、4、3其适宜的集中量数是( ),其值是 ( ),其适宜的离中量数是( )。 2、有一个学生的成绩低于平均成绩一个标准差,他在该班的百分位点是( )。 3、一组实验分数近似正态分布,其平均分为65.5,标准差为5分,问分数在55.5分和75.5 分之间的人数与全体考生总人数的百分比是( )。 4、一般人群中每年溃疡的患病率为40%,在一个200名的CEO的样本中,近12个月中有32个患溃疡。为检验CEO与一般人群溃疡的患病率是否不同,需用( )检验,所得到的统计量为( ),结论为( )。 5、一位研究者报告重复测量的方差分析中,F检验的结果是F(2,8)4.29,根据此结果可知此研究有( )个被试。 6、一位研究者调查了n=200的青少年样本,发现阅读分数与某个脑电指标的相关是0.12。他进一步抽取了极端组,发现轻微阅读障碍的儿童与同样指标的相关增加到0.61,你如何解释这个差异( )。 7、用变量X预测变量Y,已知X和方是5,回归线的离差乘积和是10,变量X、Y的均值为X=2,Y=4,预测变量Y的回归方程是( )。 8、有n=102的数据,已知积差相关系数r=0.06,Y的和方SSy=100,如果这些数据作为建立回归方程的根据,则估计的标准误是( )。 9、已知Y的回归方程是Y=2.4X-0.2,SSx=10,SSy=90,SSe=32.40,变量X与Y的积差相关系数是( )。 10、一位专家请5个暴力罪犯和5个大学生写一段文字,然后将其笔记按其字观察反社会人格的程度,从1-10排列,研究者应对其数据进行( )的统计检验。 三、简答 1、一位研究者用2*4的方差分析研究成就动机对问题解决的容易程度的影响(成就动机2水平,解决问题的容易程度有4个水平),采取组间设计,设各单位个有6个被试。下列方差分析标总结了实验结果,填充表值: 来源 SS df MS 间 280 ( ) ( )2、学生辅导中心办了一系列学习方法的讲座,为评估整个系列讲座的效果,随机抽取了25个参加讲座的学生,调查了他们在系列讲座开始前那个学期的GPA和系列讲座结束后那个学期的 GPA,从 差异均值分布看,这25个参加讲座的学生提高了D10.72,和方SS=24,用数据来对系列讲座提高 GPA的效应进行点估计和90%的区间估计。 3、下面的实验表明被试在不同唤醒水平完成不同难度任务的作业成绩,根据假设检验的结 果画 图,描述并解释任务难度与唤醒水平之间的交互作用。 低中高简单任务n=10X=80SS=30n=10X=100SS=36n=10X=120SS=45复杂任务n=10X=60SS=42n=10X=100SS=27n=10X=80SS=36X25296 4、一位牙究者发现大白鼠在T型迷津实验中有右转弯的偏好,在20次系列实验中,一只大 白鼠右 转17次,左转3次,用适当的假设检验验证大白鼠在T型迷津中右转弯好偏好是否在统计上显著? 5、下面两个表中报告的是研究者建立的预测大学生是否愿意求助心理咨询的回归模型,解释和报 告结果。(注:2003年的试题没有英语题) Model summaryRR2Adjusted R2Standard Error of the estimateR2 chargeF chargeSignificant F charge 10.2480.0620.05817.8040.06217.0400.001020.2940.0870.08017.5950.025701110.0081 Predictors 对心理咨询的看法 2 Predictors 对心理咨询的看法,遇到的问题类型是否与人际关系有关。 Coefficients Unstandardized Standardized Coefficients Coefficients t Sig. Mode B std. Error Beta 1(constant) 25.639 4.164 .248 6.157 .000 对心理咨询的看法 .346 .084 4.128 .000 2(constant) 24.510 4.138 .240 5.923 .000 对心理咨询的看法 .335 .083 4.035 .000 遇到问题的类型 6.722 2.521 .159 2.667 .008 是否与人际关系有关 四、应用题 1、一位研究者对智商与5岁儿童词汇量的关系感兴趣, A、解释如何用积差相关考察这个问题,具体描述研究者应当如何收集数据? B、解释如何用卡方独立性检验考察这个问题,具体描述研究者应当如何收集数据? 2、下面的实验显示了睡眠剥夺对智力活动的影响,8个被试同意48个小时保持不睡眠,每隔12个小时,研究者给被试若干算术题,表中记录了10分钟内被试正确解决的算术题数目。 睡眠剥夺时间 被试 12 24 36 48 - 1 8 7 8 6 2 10 12 9 11 3 9 9 8 10 4 7 8 6 6 5 12 10 10 8 6 10 9 12 8 7 7 7 6 8 8 9 10 11 11 根据上述数据,研究者能否做出睡眠剥夺对被试基本智力活动有显著影响的结论?在a=0.05水平 作假设检验和事后检验。2004北京大学心理统计 三、计算题2、有40人接受调查。 支持 不支持 观看比赛前 30 10 观看比赛后 15 25看比赛前后有否差异?四、应用题(20)有一个持错误观点的博士生,认为只有研究检验达到显著性水平才会通过论文答辩,他自编了量表,希望发现正常人和有犯罪前科的人在量表得分上有显著差异,现在他有一个50人的正常人得分38,他可以在找到一个100人的有犯罪前科的大学生样本或者25人有犯罪记录的高中生样本,现知道前者可能来自总分为35的总体,后者来自30分,那么他应选哪个组?(要写明计算过程,只写答案不给分)2005北京大学心理统计 一、选择2*71.数据类型,职位和薪水变化二、填空点估计的要求:-、-和一致性20道是非题(每题1分),单凭猜测,90%可能在-分和-分之间。三、计算1、两组人,各6个,比较哪组离散程度大。2、精神病学家认为,25%的人至少有一次想到自杀。有人调查400人,有64人报告想过。以.05水平做判断。四、有人研究反馈对评价的影响.让一个经理对人给出正的负的反馈,大概是这些人对其评价.正的负的人数大约一半.M/SD 正的:男8.85/3.25,女9.33/2.89.负的:男8.0/3.11,女6.85/2.10.有个结论的叙述:正的(M=9.08)与负的(M=7.46)效应F(1,46)=19.44,P<.0001,这一效应受交互作用限制,F(1,46)<.05,. 问题:1,各组人数是多少.2,列方差分析表.3,下划线的句子含义.卷上没线,大约是叙述后面的,特别是受限制那句.2006北京大学心理统计 五. 统计单选 (共15题, 每题2分, 最后3题是多元统计.)六. 统计计算题 (2题, 每题8分)1. 两列数据, 先问有没有方差齐性, 再问有没有显著差异. 蛮简单的一道用独立t的.2. 99%置信度的区间估计, Z分数.七. 应用题 (14分)题目有点意思. 实验者先用双因素ANOVA, 算出只有A因素有显著作用, B因素和交互作用都不显著. (这里是第一问, 填全ANOVA表, 多了一个填统计效力的) 于是实验者改成只有A因素的单因素ANOVA, 要求按上述数据列出单因素ANOVA表格.