心理与教育统计学第1章绪论.ppt
心理与教育统计学心理与教育统计学郑丽军郑丽军西南大学西南大学 心理学部心理学部心理统计心理统计I心理统计心理统计II包括包括14章,章,2学期学学期学完完教材与参考书教材与参考书现代心理与教育统计学现代心理与教育统计学张厚粲张厚粲 徐建平北京师徐建平北京师范大学范大学教育与心理统计学教育与心理统计学张敏强张敏强 人民教育出版社人民教育出版社心理统计心理统计英文英文9版,版,Runyon,人民邮电出版,人民邮电出版社社概率论与数理统计概率论与数理统计第四版第四版 浙江大学浙江大学 盛骤等编盛骤等编 高等教育出版社高等教育出版社 学习要求学习要求多种途径学习多种途径学习上课认真听讲上课认真听讲课下仔细学习教材课下仔细学习教材网络上的资料网络上的资料学术论文学术论文交流讨论交流讨论调查实践调查实践学习小组学习小组确定学习小组确定学习小组56人一小组人一小组学习小组的职责学习小组的职责学习交流的基本单元学习交流的基本单元分工合作完成调查或实验分工合作完成调查或实验讨论确定统计分析方法讨论确定统计分析方法完成研究报告完成研究报告发现问题,解决问题发现问题,解决问题成绩考核成绩考核平时成绩平时成绩30%+考试成绩考试成绩70%平时成绩包括平时成绩包括出勤出勤10%+小组贡献小组贡献20%附加分:积极发言;作为被试参加心理学实附加分:积极发言;作为被试参加心理学实验,并对实验进行分析,如实验目的、统计验,并对实验进行分析,如实验目的、统计方法、改进建议等;设计、实施研究方法、改进建议等;设计、实施研究课堂纪律课堂纪律不迟到不迟到不在课堂吃东西不在课堂吃东西不在课堂玩电脑不在课堂玩电脑不在课堂上谈论无关话题不在课堂上谈论无关话题第第1章章 绪论绪论1.1 什么是统计学?什么是统计学?1.2 为什么要学习统计学?为什么要学习统计学?1.3 统计学的基本内容统计学的基本内容1.4 统计学的基础概念统计学的基础概念1.5 学习统计学的注意事项学习统计学的注意事项1.1 什么是统计学?什么是统计学?统计活动源远流长,自从人类社会有了数统计活动源远流长,自从人类社会有了数的概念,统计就开始了,但很晚才成为一的概念,统计就开始了,但很晚才成为一门科学。门科学。统计工作最初是为统治者治理国家的需要统计工作最初是为统治者治理国家的需要而组织的收集资料工作。而组织的收集资料工作。古埃及、古希腊、罗马人口和财产登记古埃及、古希腊、罗马人口和财产登记中国的大禹划分全国为中国的大禹划分全国为9州,分田赋为州,分田赋为9等,等,编制编制禹贡九州篇禹贡九州篇1.1.1 统计学的创立统计学的创立统计学的萌芽产生在欧洲。统计学的萌芽产生在欧洲。17世纪中叶至世纪中叶至18世纪中叶是统计学的创立时期。世纪中叶是统计学的创立时期。政治算术政治算术,英国,用数字表达国情事实,英国,用数字表达国情事实国势学国势学,德国,文字记述国家的显著事项,德国,文字记述国家的显著事项政治算术政治算术威廉威廉配第配第(William Petty,1623-1687)1690年年政治算术政治算术用数字用数字来表达国情。在这部书中,来表达国情。在这部书中,他利用实际资料,运用数字、他利用实际资料,运用数字、重量和尺度等统计方法对英重量和尺度等统计方法对英国、法国和荷兰三国的国情国、法国和荷兰三国的国情国力,作了系统的数量对比国力,作了系统的数量对比分析,从而为统计学的形成分析,从而为统计学的形成和发展奠定了方法论基础。和发展奠定了方法论基础。威廉威廉佩蒂是政治经济学佩蒂是政治经济学之父,在某种程度上也之父,在某种程度上也是统计学的创始人。是统计学的创始人。马克思马克思政治算术政治算术约翰约翰格朗特(格朗特(John Graunt)(1620-1674)1662年年 发表了发表了关于死亡关于死亡公报的自然和政治观察公报的自然和政治观察的论的论著。书中分析了著。书中分析了60年来伦敦居年来伦敦居民死亡的原因及人口变动的关民死亡的原因及人口变动的关系,首次提出通过大量观察,系,首次提出通过大量观察,可以发现新生儿性别比例具有可以发现新生儿性别比例具有稳定性和不同死因的比例等人稳定性和不同死因的比例等人口规律;并且第一次编制了口规律;并且第一次编制了“生命表生命表”,对死亡率与人口寿,对死亡率与人口寿命作了分析,从而引起了普遍命作了分析,从而引起了普遍的关注。的关注。他的研究清楚地表明他的研究清楚地表明了统计学作为国家管了统计学作为国家管理工具的重要作用,理工具的重要作用,人口统计学的起源。人口统计学的起源。国势学国势学海尔曼海尔曼康令(康令(H.Conring,16061681)第一个在德国黑尔姆斯太第一个在德国黑尔姆斯太特大学以特大学以“国势学国势学”为题为题讲授政治活动家应具备的讲授政治活动家应具备的知识。知识。1730年年 国势学讲义国势学讲义国势学国势学高特弗里德高特弗里德阿亨华尔(阿亨华尔(G.Achenwall,17191772)1974年年近代欧洲各国国势学纲近代欧洲各国国势学纲要要,书中讲述,书中讲述“一国或多数国家一国或多数国家的显著事项的显著事项”,主要用对比分析的,主要用对比分析的方法研究了解国家组织、领土、人方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了口、资源财富和国情国力,比较了各国实力的强弱。各国实力的强弱。将国势学取名为统计学将国势学取名为统计学(statistik),这一德文词汇转译为英文这一德文词汇转译为英文statistic。1850年德国人克尼斯(年德国人克尼斯(K.G.Knies)发发表表独立科学之统计学独立科学之统计学认为认为“国势国势学学”尽管有统计学之名,但没有统计尽管有统计学之名,但没有统计学之实,应该仍然叫学之实,应该仍然叫“国势学国势学”,而,而“政治算术政治算术”才是正真的统计学。才是正真的统计学。1.1.2 统计学发展统计学发展统计学的理论基础统计学的理论基础概率论概率论随机现象则是指在基本条件不变的情况随机现象则是指在基本条件不变的情况下,一系列试验或观察会得到不同结果下,一系列试验或观察会得到不同结果的现象。的现象。事件的概率则是衡量该事件发生的可能事件的概率则是衡量该事件发生的可能性的量度。性的量度。概率论概率论16世纪,伽利略为解答赌徒们提出的问题,提出了概率论的基本原理。(Galileo Galilei,1564-1642)概率论概率论17世纪中期,帕斯卡和费马关于“得点问题”的讨论,奠定了概率论的基础。布莱士帕斯卡(Blaise Pascal,16231662)费马(Pierre de Fermat,16011665)概率论概率论17世纪末世纪末18世纪初世纪初贝努里贝努里贝努里定理贝努里定理棣莫弗、高斯、拉普拉斯棣莫弗、高斯、拉普拉斯正态曲线方正态曲线方程程泊松泊松大数定理大数定理其他学者:莱布尼茨、贝叶斯、勒让德、贝其他学者:莱布尼茨、贝叶斯、勒让德、贝塞尔、辛普生等塞尔、辛普生等描述统计学描述统计学描述统计学产生于描述统计学产生于19世纪末,在描述统计世纪末,在描述统计方面做出重要贡献的是英国的优生学家方面做出重要贡献的是英国的优生学家高尔顿(FGalton)和统计学家和统计学家皮尔逊(KPearson)高尔顿(FGalton,1822-1911)卡尔皮尔逊(Karl Pearson,1857-1936)推论统计学推论统计学推论统计的先驱是英国统计学家推论统计的先驱是英国统计学家格赛特(WGosset),对推断统计做出重要贡献的对推断统计做出重要贡献的是英国统计学家是英国统计学家费舍尔(RAFisher)。William Sealy Gosset(18761937)Ronald Aylmer Fisher(18901962)心理与教育统计的产生和发展心理与教育统计的产生和发展心理与教育统计作为数理统计的一门应用心理与教育统计作为数理统计的一门应用学科,是随着数理统计的发展而发展的。学科,是随着数理统计的发展而发展的。最初应用统计方法于教育与心理方面研究最初应用统计方法于教育与心理方面研究的是的是高尔顿高尔顿。对教育统计做出重要贡献的。对教育统计做出重要贡献的是心理学家是心理学家斯皮尔曼斯皮尔曼。查尔斯爱德华斯皮尔曼(Charles Edward Spearman1863-1945)心理与教育统计的产生和发展心理与教育统计的产生和发展随着科学研究中心的转移,心理与教育统随着科学研究中心的转移,心理与教育统计的研究也移向美国。为心理与教育统计计的研究也移向美国。为心理与教育统计学做出较大贡献的是美国教育与心理学家学做出较大贡献的是美国教育与心理学家桑代克桑代克(Thorndikt)、)、瑟斯顿瑟斯顿(Thurstone)和)和卡特尔卡特尔(Cattell)。)。桑代克(Edward.Thorndike 18741949)路易斯列昂瑟斯顿(Louis Leon Thurstone18871955)雷蒙德.卡特尔(Cattell,Raymond B19051998)1.2 为什么要学习统计学?为什么要学习统计学?常识和轶闻不等于科学常识和轶闻不等于科学在交通工具中,飞机、火车、汽车哪一种更危险在交通工具中,飞机、火车、汽车哪一种更危险?很多人下意识地说飞机最危险很多人下意识地说飞机最危险据美国全国安委会对据美国全国安委会对19931995年间所发生的伤年间所发生的伤亡事故的比较研究,坐飞机比坐汽车要安全亡事故的比较研究,坐飞机比坐汽车要安全22倍。倍。相对于汽车和其它交通工具,飞机大概每飞行相对于汽车和其它交通工具,飞机大概每飞行300万次才发生一起故障,也就是说,如果一个乘万次才发生一起故障,也就是说,如果一个乘客每天做一次飞行,那他要不停的坚持客每天做一次飞行,那他要不停的坚持8200年才年才可能赶上一次空难。可能赶上一次空难。工作生活也需要统计学工作生活也需要统计学从随机中发现规律偶然与必然随机现象统计学研究的就是随机现象,是帮助人们发现随机现象运动规律的科学,它的基本技术就是分析随机现象各种表现随机事件的发生概率及其分布规律。心理与教育研究数据的特点心理与教育研究数据的特点心理与教育科学研究数据与结果多用心理与教育科学研究数据与结果多用数字数字形式呈现。形式呈现。心理与教育科学研究数据具有心理与教育科学研究数据具有随机随机性和性和变变异异性。性。心理与教育科学研究数据具有心理与教育科学研究数据具有规律规律性。性。心理与教育科学研究的目标是通过心理与教育科学研究的目标是通过部分部分数数据来据来推测推测总体总体特征。特征。心理与教育统计使我们能以最少的样本含心理与教育统计使我们能以最少的样本含量,达到我们所需要的精确度,对总体的量,达到我们所需要的精确度,对总体的有关参数等作出判断,同时又给出发生错有关参数等作出判断,同时又给出发生错误的可能性。它保证了科学研究的精确性、误的可能性。它保证了科学研究的精确性、可靠性和经济性。可靠性和经济性。1.2.2 科学研究需要统计学科学研究需要统计学问卷调查问卷调查行为实验行为实验眼动实验眼动实验事件相关电位实验事件相关电位实验功能性磁共振实验功能性磁共振实验问卷调查行为实验眼动实验事件相关电位实验功能性磁共振实验统计与研究设计根据统计规律设计研究统计解决研究中的不足缺失值协变量控制小样本有数据的地方就有统计医学与卫生统计学经济统计学社会统计学农林统计学学习统计需要注意p5如何看待统计?统计是手段而不是目的1.3 统计学的基本内容统计学的基本内容应用统计学(社科领域中的应用)应用统计学(理工科领域中的应用)理论统计学物理学生物学医学气象学地理学统计力学生物统计学医学统计学气象统计学地理统计学人口学心理学教育学管理学社会学人口统计学心理统计学教育统计学管理统计学社会统计学统计学的整体结构1.3.1 心理与教育统计学的研究内容心理与教育统计学的研究内容描述统计描述统计推论统计推论统计实验设计实验设计心理与教育统计学心理与教育统计学描述统计描述统计对已获得的数据进行整理、概括,显现其对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计分布特征的统计方法,称为描述统计统计图统计图简化数据简化数据平均值、方差、变异系数平均值、方差、变异系数相关分析相关分析推论统计推论统计推论统计主要研究通过局部数据所提供的信息,推论总体情形。统计估计参数估计、非参数估计假设检验参数检验、非参数检验大样本检验方法(Z检验)小样本检验方法(t检验)计数资料的检验方法(2检验)变异数分析方法(F检验)回归分析实验设计实验设计实验者为了揭示实验中自变量与因变量之实验者为了揭示实验中自变量与因变量之间的关系,在实验之前所制订的实验计划,间的关系,在实验之前所制订的实验计划,称为实验设计。称为实验设计。包括选择怎样的抽样方式;包括选择怎样的抽样方式;如何计算样本容量;如何计算样本容量;确定怎样的实验对照形式;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。用什么统计方法处理及分析实验结果,等等。1.3.2 统计的地位统计的地位概念框架现象行为测量设计统计推论实验金字塔(Anderson,2001)1.4 统计学的基础概念统计学的基础概念数据类型数据类型变量、观测值、随机变量变量、观测值、随机变量总体、样本与个体总体、样本与个体次数、比率、频率与概率次数、比率、频率与概率参数量与计算量参数量与计算量误差误差1.4.1 数据的类型数据的类型称名数据称名数据:性别:性别顺序数据顺序数据:宗教认知:宗教认知等距数据等距数据:IQ比率数据比率数据:收入:收入女性女性男性男性不那么重要不那么重要一般一般很重要很重要非常重要非常重要951001051101150$10,000$20,000$30,000$40,000$50,0001.4.1 数据类型数据类型分类数据分类数据等级数据等级数据等距数据等距数据比率数据比率数据计数数据计数数据离散型数据离散型数据测量数据测量数据连续型数据连续型数据1.4.2 变量、观测值、随机变量变量、观测值、随机变量变量变量(variables)指心理与教育实验、观察、调查指心理与教育实验、观察、调查中想要获得的数据,可以取不同的值。如大学生中想要获得的数据,可以取不同的值。如大学生的身高。的身高。一旦确定了某个值,就称这个值为某一变量的一旦确定了某个值,就称这个值为某一变量的观观测值测值(observation)。如某个大学生的身高。如某个大学生的身高。用来表示随机现象的变量,称为用来表示随机现象的变量,称为随机变量随机变量随机变量随机变量。一般。一般用大写的或表示随机变量。用大写的或表示随机变量。在个别试验中其结果呈现不确定性,在大量重复在个别试验中其结果呈现不确定性,在大量重复实验中其结果又具有统计规律的现象为实验中其结果又具有统计规律的现象为随机现象随机现象。如投掷硬币如投掷硬币1.4.2 总体、样本与个体总体、样本与个体总体总体(Population)所要研究对象的全体,)所要研究对象的全体,它们具有某个共同属性。它们具有某个共同属性。N,总体容量未必,总体容量未必无限无限个体个体(individual)构成总体的每个基本单元。构成总体的每个基本单元。样本样本(sample)从总体中抽取的一部分个)从总体中抽取的一部分个体。体。样本中包含的样本中包含的个体数,称为样本的,称为样本的容量n。一般把容量一般把容量n 30的样本称为大样本;的样本称为大样本;而而n 30的样本称为小样本。的样本称为小样本。1.4.2 总体、样本与个体总体、样本与个体样本和被试有区别:一个样本既可能来自样本和被试有区别:一个样本既可能来自对一组被试的一次观测,也可能来自对一对一组被试的一次观测,也可能来自对一个被试的多次观测。个被试的多次观测。一组被试既可能是总体,也可能是样本,一组被试既可能是总体,也可能是样本,视研究问题而定。视研究问题而定。例子:例子:中国人左手掷铅球远,还是右手掷铅球远中国人左手掷铅球远,还是右手掷铅球远?小明左手掷铅球远,还是右手掷铅球远?小明左手掷铅球远,还是右手掷铅球远?1.4.3 次数、比率、频率与概率次数、比率、频率与概率次数:某一事件在某一类别中出现的数目,次数:某一事件在某一类别中出现的数目,又称为频数(又称为频数(frequency)。)。比率:两个数的比,又称为比例,百分数比率:两个数的比,又称为比例,百分数或百分率。或百分率。频率:又称相对次数,某一事件发生的次频率:又称相对次数,某一事件发生的次数与总的事件数目之比。数与总的事件数目之比。概率:用概率:用P表示,指某一事件在无限的观测表示,指某一事件在无限的观测中所能预料的相对出现次数中所能预料的相对出现次数,取值范围取值范围0,11.4.4 参数和统计量参数和统计量参数参数(parameter):总体的特性,是一常数,:总体的特性,是一常数,通过样本特征值预测,希腊字母。通过样本特征值预测,希腊字母。统计量统计量(statistics):样本的那些特征值,是:样本的那些特征值,是一变量,随样本的变化而变化,英文字母。一变量,随样本的变化而变化,英文字母。统计指标统计指标统计量统计量参数参数平均数平均数标准差标准差SD相关系数相关系数r回归系数回归系数b1.4.5 误差误差测量值测量值=真实值真实值+误差误差误差分为系统误差、随机误差误差分为系统误差、随机误差系统误差来源:测量误差、抽样误差系统误差来源:测量误差、抽样误差由于使用的仪器、测量方法、读数方法等由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称问题造成的测得值与真值之间的误差,称为测量误差。为测量误差。由于随机抽样造成的样本统计量与总体参由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差。数间的差别,称为抽样误差。心理与教育的研究不可能避免误差,心理与教育的研究不可能避免误差,只可能减少误差。只可能减少误差。改进仪器、合理的抽样设计的目的,改进仪器、合理的抽样设计的目的,就是保证研究达到所需要的精确度,就是保证研究达到所需要的精确度,同时在兼顾投入的人力、物力和财力同时在兼顾投入的人力、物力和财力条件下尽量减小系统误差。条件下尽量减小系统误差。1.5 学习统计学的注意事项学习统计学的注意事项用统计认识事物的完整步骤:研究设计用统计认识事物的完整步骤:研究设计抽样调查抽样调查统计推断统计推断结论。我们主要结论。我们主要关心第三阶段,但实际上前两个步骤是统计是关心第三阶段,但实际上前两个步骤是统计是否有意义的先决条件。否有意义的先决条件。拿到数据后的一般步骤是:数据整理拿到数据后的一般步骤是:数据整理确确定变量类型定变量类型描述统计描述统计推断统计推断统计结果报告。结果报告。又以描述统计和推断统计最为重要,也是本课又以描述统计和推断统计最为重要,也是本课程的学习重点;强调研究设计是保证后继的统程的学习重点;强调研究设计是保证后继的统计是否得当和有效的先决条件。计是否得当和有效的先决条件。统计方法只是研究的工具,决定研究质量统计方法只是研究的工具,决定研究质量的关键是理论设想和预先的研究设计。的关键是理论设想和预先的研究设计。不同性质的变量对应不同的统计方法,关不同性质的变量对应不同的统计方法,关键要掌握不同方法的适用条件。键要掌握不同方法的适用条件。注意科研道德,删除数据要有根据,不能注意科研道德,删除数据要有根据,不能主观删除数据,编造数据。主观删除数据,编造数据。克服畏难情绪。克服畏难情绪。要做一定的练习。要做一定的练习。作业作业列举可以描述列举可以描述“人人”属性的变量,并进行归类属性的变量,并进行归类称名数据:称名数据:XXXX顺序数据:顺序数据:XXXX等距数据:等距数据:XXXX等比数据:等比数据:XXXX评分指标:正确率评分指标:正确率+变量数变量数以组为单位,下周内课堂上交以组为单位,下周内课堂上交谢谢!谢谢!