07第七章 定量资料的分析.ppt
《07第七章 定量资料的分析.ppt》由会员分享,可在线阅读,更多相关《07第七章 定量资料的分析.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 定量资料的分析定量资料的分析第二节第二节 统计描述与推断统计描述与推断第三节第三节 假设检验假设检验第四节第四节 统计分析统计分析第一节第一节 统计的理解统计的理解第一节第一节 统计的理解统计的理解统计是一种语言统计是一种语言统计是一种规律统计是一种规律统计是一种思想统计是一种思想统计是一种工具统计是一种工具第二节 平均值、标准差和相关系数 统计分析需要处理的是统计数据。表征某一随机现象统计分析需要处理的是统计数据。表征某一随机现象的统计数据总是具有一定的特征。描述统计数据特征的是的统计数据总是具有一定的特征。描述统计数据特征的是特征量,常用的特征量有:集中量、差异量和相关量。平
2、特征量,常用的特征量有:集中量、差异量和相关量。平均值、标准差、相关系数分别是最常用的集中量、差异量均值、标准差、相关系数分别是最常用的集中量、差异量和相关量和相关量。一一、集中量和平均值集中量和平均值 集中量是代表一组数据典型水平或集中趋势的集中量是代表一组数据典型水平或集中趋势的 量,反映频数分布中大量数据向某一点集中的情量,反映频数分布中大量数据向某一点集中的情 况。平况。平均值(算术平均值均值(算术平均值)是统计学中最容易理解和最常用的集是统计学中最容易理解和最常用的集中量指标,可以表示为:中量指标,可以表示为:数据向平均值集中的趋势数据向平均值集中的趋势二、二、差异量和方差、标准差差
3、异量和方差、标准差 集中量可以描述一组数据的平均水平、向某一点集中集中量可以描述一组数据的平均水平、向某一点集中的趋势,但没有反映一组数据的全部特征。一组数据,的趋势,但没有反映一组数据的全部特征。一组数据,不仅有不仅有 集中的趋势,同时,也有离散的、变异的状态。集中的趋势,同时,也有离散的、变异的状态。比如比如,两组学生测验成绩如下:两组学生测验成绩如下:甲组甲组 54,63,72,74,82,88,99 乙组乙组 67,71,73,76,79,82,84 虽然平均分都是虽然平均分都是76,但离散的程度却不同。,但离散的程度却不同。表示一组数据变异程度或离散程度的量称为差异量。表示一组数据变
4、异程度或离散程度的量称为差异量。差异量越大表示数据分布范围越广、越不整齐;差异差异量越大表示数据分布范围越广、越不整齐;差异量越小,表示数据分布得越集中,变动范围越小。量越小,表示数据分布得越集中,变动范围越小。左图数据差异量或离散程度大,数据分布范围广、右图数左图数据差异量或离散程度大,数据分布范围广、右图数据差异量小,数据分布得比较集中。据差异量小,数据分布得比较集中。方差和标准差是使用最广泛的差异量。方差是离差平方和方差和标准差是使用最广泛的差异量。方差是离差平方和的算术平均数。其定义式为:的算术平均数。其定义式为:标准差是方差的平方根。其定义式为:标准差是方差的平方根。其定义式为:标准
5、分标准分 标准分是以标准差为单位来计量每个分属于平均分之间的标准分是以标准差为单位来计量每个分属于平均分之间的离差。(某个分数的离均差包含几个标准差)反映某个分离差。(某个分数的离均差包含几个标准差)反映某个分数在所有分数中的相对位置。数在所有分数中的相对位置。标准分数标准分数标准分数又称标准分数又称z分数,是以标准差为单位表示一个分数在全分数,是以标准差为单位表示一个分数在全部数据中所处的相对位置。部数据中所处的相对位置。标准分数的定义式是:标准分数的定义式是:三三 、相关系数、相关系数 平均值、标准差都是对单变量进行描述的特征量。对两个平均值、标准差都是对单变量进行描述的特征量。对两个变量
6、之间的变化关系需要用相关量来描述。变量之间的变化关系需要用相关量来描述。两个变量之间的变化关系从变化方向看,有三种情况:两个变量之间的变化关系从变化方向看,有三种情况:正相关正相关 两个变量的变化方向一致。一个变量值变大时,两个变量的变化方向一致。一个变量值变大时,另一个变量值也随之变大。另一个变量值也随之变大。负相关负相关 两个变量的变化方向相反。一个变量值变大时,两个变量的变化方向相反。一个变量值变大时,另一个变量值随之变小。另一个变量值随之变小。零相关零相关 两个变量值变化方向无一定规律。一个变量值两个变量值变化方向无一定规律。一个变量值变大时,另一个变量值可能变大也可能变小,并且变大变
7、大时,另一个变量值可能变大也可能变小,并且变大变小的机会趋于相等。这样的关系称为零相关,两个变变小的机会趋于相等。这样的关系称为零相关,两个变量之间无相关。量之间无相关。相关系数相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,一般用系数,一般用 r r 表示。表示。相关系数的取值范围是在相关系数的取值范围是在-1-1到到+1+1之间。之间。+、-号表示相关关系的方向。号表示相关关系的方向。+号表示变化方向一致,为正相关。号表示变化方向一致,为正相关。-号表示变化方向相反,为负相关。号表示变化方向相反,为负
8、相关。r r 的绝对值表示两个变量之间的的绝对值表示两个变量之间的密切程度。绝对值越接近密切程度。绝对值越接近1 1,表示两个变量之间关系密切,越接近,表示两个变量之间关系密切,越接近0 0,表示两个变量间的关系越不密切。表示两个变量间的关系越不密切。相关系数只能描述两个变量之间的变化方向及密切程度,不能表明二相关系数只能描述两个变量之间的变化方向及密切程度,不能表明二者之间的本质联系,分析内在的本质联系需要有关的专业知识。相关者之间的本质联系,分析内在的本质联系需要有关的专业知识。相关关系也不能确定两个变量间的因果关系,两个相关变量间是否存在因关系也不能确定两个变量间的因果关系,两个相关变量
9、间是否存在因果关系同样需要根据有关知识和经验做进一步的分析。果关系同样需要根据有关知识和经验做进一步的分析。积差相关系数的定义式积差相关系数的定义式:两个变量离差乘积之和除以两个变量离差乘积之和除以n 所得之商所得之商称为协方差称为协方差。离差。离差积之和的大小,反映两个变量之间的关系。两个离差除以积之和的大小,反映两个变量之间的关系。两个离差除以相应的标准差,变成两个标准分,把协方差变成相对量。相应的标准差,变成两个标准分,把协方差变成相对量。积差相关系数就是两个变量离差除以各自的标准差所得标积差相关系数就是两个变量离差除以各自的标准差所得标准分乘积之和除以准分乘积之和除以 n所得之商。数值
10、范围在所得之商。数值范围在-1.00至至1.00之之间间。四四、SPSS概述概述(一)(一)SPSS简介简介 SPSS(Statistical Package for the Social Science,社会科学统计软件包社会科学统计软件包)是由美国是由美国SPSS公司自公司自20世纪世纪80年年代开发的大型统计学软件包,自代开发的大型统计学软件包,自1985年推出年推出V 1.0以来,以来,版本不断更新,目前已推出版本不断更新,目前已推出V 16.0的最新版本。功能更的最新版本。功能更加强劲,操作更加简便,并且与其他统计及数据库软件,加强劲,操作更加简便,并且与其他统计及数据库软件,如如E
11、xcel、DaBase、Foxbase、Access等的兼容性不等的兼容性不断增强,因此它是目前世界最流行的统计软件之一,也断增强,因此它是目前世界最流行的统计软件之一,也是社会科学研究人员首选的统计软件。是社会科学研究人员首选的统计软件。(二)(二)SPSS操作基本过程操作基本过程SPSS功能强大,操作简单。运用功能强大,操作简单。运用SPSS对数据进行统计对数据进行统计处理的基本过程如下:处理的基本过程如下:1建立数据库,录入数据:一是定义变量,二是录入变建立数据库,录入数据:一是定义变量,二是录入变量值;量值;2对数据进行预处理:根据需要,对数据进行整理、分对数据进行预处理:根据需要,对
12、数据进行整理、分组、合并、排序等;组、合并、排序等;3统计分析:按研究要求的统计分析方法,对数据进行统计分析:按研究要求的统计分析方法,对数据进行处理;处理;4数据呈现:生成数据表和可视化图形;数据呈现:生成数据表和可视化图形;5保存和导出结果:可将结果以数据库文件格式存贮,保存和导出结果:可将结果以数据库文件格式存贮,并能以常见的数据格式输出。并能以常见的数据格式输出。(三)(三)SPSS应用应用1启动和输入数据启动和输入数据启动启动SPSS即进入主画面新数据窗口,这时可以定义变量,即进入主画面新数据窗口,这时可以定义变量,输入、编辑数据文件。输入、编辑数据文件。(1)定义变量:)定义变量:
13、定义变量类型定义变量长度(2)录入数据:2计算平均值和标准差计算平均值和标准差录入数据或打开数据文件后,点击菜单选项录入数据或打开数据文件后,点击菜单选项AnalyzeDescriptive StatisticsDescriptives,出现对话框。在,出现对话框。在左侧的源变量框中选择一个或多个变量,点击箭头图标,左侧的源变量框中选择一个或多个变量,点击箭头图标,进入变量框进入变量框variable(s)ok,得到输出结果(得到输出结果(Output)。)。3计算相关系数计算相关系数录入数据或打开数据文件后,点击菜单选项录入数据或打开数据文件后,点击菜单选项AnalyzeCorrelateB
14、ivariate,出现二元变量相关分析对话框。,出现二元变量相关分析对话框。在此对话框中做如下操作:在此对话框中做如下操作:(1)选择分析变量:从源变量框中选定需要做相关分析)选择分析变量:从源变量框中选定需要做相关分析的变量进入变量框;的变量进入变量框;(2)选择分析方法:通常选皮尔逊相关)选择分析方法:通常选皮尔逊相关(pearson)计算连计算连续变量的相关。续变量的相关。选择完成后,点击选择完成后,点击ok,得出输出结果。得出输出结果。显著性检验选项显著性检验选项 双尾检验、单尾检验,是否显示显著性水双尾检验、单尾检验,是否显示显著性水平。平。输出结果输出结果 为一相关矩阵。矩阵中每个
15、值为对应行、列两为一相关矩阵。矩阵中每个值为对应行、列两个变量的相关系数。同时显示参与计算的样本数和显著性个变量的相关系数。同时显示参与计算的样本数和显著性水平(相关系数为水平(相关系数为0 0的假设成立的概率)。的假设成立的概率)。一一、基本原理、基本原理 检验一般有两个相互对立的假设:虚无假设(亦称零假设)检验一般有两个相互对立的假设:虚无假设(亦称零假设)(H0)和研究假设(亦称备择假设)和研究假设(亦称备择假设)(H1)。虚无假设是关于当前样。虚无假设是关于当前样本所属的总体与假设总体无区别的假设,即认为两者之间没有差本所属的总体与假设总体无区别的假设,即认为两者之间没有差异。备择假设
16、与虚无假设正相反,是根据样本信息否定了虚无假异。备择假设与虚无假设正相反,是根据样本信息否定了虚无假设时应当选择的假设。假设检验是从虚无假设出发,根据样本统设时应当选择的假设。假设检验是从虚无假设出发,根据样本统计量的值在以假设的总体参数为中心的抽样分布上出现的概率做计量的值在以假设的总体参数为中心的抽样分布上出现的概率做出决断。当出现的概率足够小时,就可以从实际的可能性上否定出决断。当出现的概率足够小时,就可以从实际的可能性上否定零假设,接受备择假设。零假设,接受备择假设。第三节第三节 假设检验假设检验显著性水平显著性水平 统计学上把拒绝零假设的概率称为显著性水平。统计学上把拒绝零假设的概率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 07第七章 定量资料的分析 07 第七 定量 资料 分析
限制150内