《统计基础知识.ppt》由会员分享,可在线阅读,更多相关《统计基础知识.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计基础知识一、统计与测量概述一、统计与测量概述1.什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。(1)数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。(2)应用统计:统计原理在某个行业的具体应用。如社会统计学、教育统计学等。2.统计学分类3.社会统计 社会统计是运用数理统计原理和方法,研究社会问题的一门应用科学。主要包括:描述统计;(例如:体育消费的现状)推断统计;(例如:体育消费与家庭收入之间的关系)4.测量测量l 测量是根据法则给事物赋
2、予数量。测量的三要素:第一,事物的属性;第二,数字;第三,规则。5.变量的概念变量的概念 科学研究中,用变量来描述概念。变量,也称变项,变数,是说明总体各个案所具有的某正特征或者属性的名称,且被说明的特征或属性对于总体各个案来说是具有变异性的。例如:在一个地区体育人口当中,每个人的性别、年龄等都是变量。变量一般包含一个以上的亚概念或者取值。比如,性别,是一个概念,但包含男或女两个取值。年龄、态度等等都可以作为变量。自变量和应变量 自变量:又称自变项、独立变项,通常用X表示。一般是指在社会关系中引起现象发生变化的因素。自变量:又称因变项、依变量,通常用Y表示,一般是指在社会关系中随着一种因素发生
3、作用而其变化的结果。举例:体育态度Y与哪些因素有关 X1:年龄 X2:文化程度 X3:性别6.变量的测度等级(变量分类)变量的测度等级(变量分类)在实际研究中,不同概念的变量能够被测量,即,量化的程度在实际研究中,不同概念的变量能够被测量,即,量化的程度不同,所以,变量的类型有一定的层次:不同,所以,变量的类型有一定的层次:(1)定类变量(名义变量)Nominal Measurement 是指变量的值只能把研究对象进行分类,数学性质为=或者,等级最低。例如:性别,要么=男性,要么男性=女性(2)定序变量(序次变量)Ordinal Measurement 是指研究的变项值具有大小之或高低之分。数
4、学性质为或,包含了=或者,测量层次高于定类。例如:文化程度:博士;硕士;学士,既体现了文化程度的分类,同时也是一种层次的排列。(3)定距变量(间距变量)Interval Measurement 是指能确定取值得距离,即变项之值的距离可知。具有+或-的数学性质,包含了前两种测量的性质。例如:甲、乙、丙三人的工资为380、950、2000。思考:定类和定距变量的差别和转换。(4)定比变量(比率变量)Ratio Measurement 是指变量的取值之间有某种成比例的关系。据有或的数学性质,是最高测量层次的变量。例如:甲、乙工资分别为600、900,则乙是甲的2倍。思考:定距与定比变量的区别变量分类
5、的实际意义测度等级关系到数据分析时采取何种方法。关系到信息使用的效率。二、统计表构成:统计表一般由标题、表号、标目、表注等构成。编制基本原则:结构简明,一目了然。l 统计表基本格式横标目的总标目(亦可空白)纵标目(一般设谓语)横标目数字表的标题?注脚:说明资料来源等 X X X(顶线)(底线)表表1-2 研究样本分布研究样本分布区名区名编编码码镇(街)名镇(街)名编编码码居委名居委名编编码码总编码总编码海海珠珠7南华西街南华西街13鳌洲鳌洲257.13.25兆龙里兆龙里267.13.26滨江街滨江街14海印海印277.14.27远安远安287.14.28越越秀秀8洪桥街洪桥街15张家里张家里2
6、98.15.29法政法政 308.15.30东风街东风街16德坭新村社区德坭新村社区319.16.31嘉和苑社区嘉和苑社区329.16.32天天河河9石牌街石牌街17暨南大学暨南大学339.17.33华南师大华南师大349.17.34棠下街棠下街18加拿大花园加拿大花园359.18.35天安天安369.18.36东东山山10农林街农林街19竹丝岗一路竹丝岗一路3710.19.37东园新村东园新村3810.19.38建设街建设街20大马路大马路3910.20.39麓湖路麓湖路4010.20.40黄黄埔埔11荔联街荔联街21笔岗笔岗4111.21.41仓联仓联4211.21.42南岗街南岗街22四
7、航局四航局4311.22.43黄埔电厂黄埔电厂4411.22.44从从化化12街口镇街口镇23团星村团星村4512.23.45城内居委城内居委4612.23.46桃园镇桃园镇24桃园居委桃园居委4712.24.47中田村中田村4812.24.48表表3广州市各区广州市各区/县社会体育人口本区比例统计表县社会体育人口本区比例统计表区县 本区总人口 体育人口 比例%区县 本区总人口 体育人口 比例%花都 618654 300047 48.50 荔湾 521708 186511 35.75番禺 962395 481198 50.00 芳村 184723 81564 44.88增城 834156 35
8、0346 42.00 海珠 830436 432080 52.03白云 858526 343410 40.0 越秀 426698 168546 39.50天河 598353 246820 41.25 东山 627892 279412 44.50黄埔 209535 62861 30.0 从化 533153 129290 24.25 三.统计图统计图统计图由标题、图号标目、图注等项构成。1.直条图 2.圆形图3.线条图4.频数颁布直方图图.4中考化学统计成绩直方图5.累积频数图图.5 2004年中考化学抽样得分情况累积频数图 10 20 30 40 50 60 70 80 90 100图2.6:高
9、一语文四、集中量1.算术平均数()所有观察值总和除以总频数之和所得商。四、集中量2.加权平均数()是不同比重数据(或平均数)的平均数或.N表示各组的频数;X 表示各组的平均数。例1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?例2:某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩?不能用:(68+75+80)/3=74.33.教育统计中几个名词频数:随机事件在n次试验中出现的次数,称这个随机事件的频数。频数分布:各种随机事件在n次试验中出
10、现的次数分布,称为频数分布。离差:个体量和某一群体的平均量之差。教育统计中几个名词正态分布:是一种连续型随机变量的概率分布。二项式分布中当 p=q时,且n很大时,二项式分布接近于正态分布 表2:一个学生做题正误题做对不同题数的概率分布(做对每题的概率p=1/2;做错的概率为1/2)做对题数012345678910出现方式数1104512021025221012045101五、差异量1.全距(全距(R)一组数据中最大值和最小值之差表示,又称极差。2.标准差(标准差(或或S)标准差概念:标准差是指离差平方和后平均的方根。问题1:某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分
11、为70分)和 30,50,86,90,94(均分为70分)。如何评价两组的学习情况?方法一:根据定义式计算方法二:根据原始数据计算方法三:利用计算器计算方法四:利用计算机计算六、相关系数相关:是指两个或两个以上变量之间存在相互依存关系。如数学课成绩与数学竞赛成绩、数学与物理成绩等。正相关负相关零相关相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相关系数。数学与物理、物理与英语相关性比较数学与物理、物理与英语相关性比较数学数学物理物理英语英语物理物理1 170707575767675752 260606363606063633 38282757565
12、6575754 444446060565660605 552525555707055556 690909797858597977 78080898948488989r r0.91 0.91 0.26 0.26 相关系数与相关程度表一览表表相关系数与相关程度表一览表表|r|r|0 00.30.30.30.3|r r|0.50.50.50.5|0.80.81.0 1.0 相关相关程度程度零相零相关关微相微相关关切实相关切实相关密切相关密切相关高度相高度相关关完全相完全相关关教师第一次成绩 教师第二次成绩教师第一次成绩 Pearson Correlation1.985*Sig.(2-tailed).
13、000N1010教师第二次成绩Pearson Correlation.985*1Sig.(2-tailed).000N1010*.Correlation is significant at the 0.01 level(2-tailed).七、差异显著性检验假设检验的基本原理 1.假设虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的假设,一般用H1表示。u由于直接检验备择假设的真实性困难,假设检验一般都是从虚无假设出发,通过虚无假设的不真实性来证明备假设的真实性。八、差异显著性检验2.小概率事 在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05以下,即当P(A)1.96,则0.05,拒绝零假设。实验班和对照的化学成绩存在显著差异谢谢大家!结结 语语
限制150内