《《量化研究基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《量化研究基础》PPT课件.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲量化研究基础第四讲量化研究基础学习目标:n n 掌握测量对于量化研究的意义掌握测量对于量化研究的意义n n 识记不同的测量层次及其特点识记不同的测量层次及其特点n n 了解单变量统计分析的原理和方法了解单变量统计分析的原理和方法n n 能运用常用软件如能运用常用软件如EXCELEXCEL进行简单的统计分析。进行简单的统计分析。第一节第一节 测量与量表测量与量表一、测量的概念及其要素一、测量的概念及其要素“测量是按规则给对象或事件赋值测量是按规则给对象或事件赋值测量是按规则给对象或事件赋值测量是按规则给对象或事件赋值”。n n基本要素:基本要素:对象对象对象对象指我们所感兴趣的,要研究的事
2、件或物体。指我们所感兴趣的,要研究的事件或物体。标记标记标记标记指被测量对象的某种指被测量对象的某种特征特征记号,如性别、年龄、记号,如性别、年龄、职称、行为反应、态度等。职称、行为反应、态度等。符号符号符号符号指代表对象具有某种特征的指代表对象具有某种特征的程度程度的符号,如考的符号,如考试分数、品质等级等。试分数、品质等级等。规则规则规则规则分派各种符号到各类事物上的分派各种符号到各类事物上的标准标准和方法,如和方法,如考试采用百分制,品质的等级标准等考试采用百分制,品质的等级标准等。测量要素间的关系:测量要素间的关系:二、测量量表的类型类别量表类别量表:是将分类的回答项目赋予不同的符:是
3、将分类的回答项目赋予不同的符号(数字)。如,号(数字)。如,性别:男女性别:男女 地理区域:城市农村郊区地理区域:城市农村郊区特点特点:类别数据之间只有质的区别,没有量的:类别数据之间只有质的区别,没有量的区别。数字之间没有数量关系,顺序关系,不区别。数字之间没有数量关系,顺序关系,不能相加,更不能乘除。只能对总体中的每一类能相加,更不能乘除。只能对总体中的每一类别进行频率的计算以及众数的计算。别进行频率的计算以及众数的计算。顺序量表顺序量表 顺序量表的目的是顺序量表的目的是顺序量表的目的是顺序量表的目的是排序排序排序排序。因此,任何可以代表顺序因此,任何可以代表顺序因此,任何可以代表顺序因此
4、,任何可以代表顺序关系的数字系列都可以接受。顺序量表是基于可传关系的数字系列都可以接受。顺序量表是基于可传关系的数字系列都可以接受。顺序量表是基于可传关系的数字系列都可以接受。顺序量表是基于可传递的假设。可描述成:递的假设。可描述成:递的假设。可描述成:递的假设。可描述成:“如果如果如果如果a a大于大于大于大于b b,而,而,而,而b b大于大于大于大于c c,则则则则a a大于大于大于大于c c。”如:如:请对下列自行车品牌按请对下列自行车品牌按请对下列自行车品牌按请对下列自行车品牌按1 1 1 1到到到到4 4 4 4进行排序,其中进行排序,其中进行排序,其中进行排序,其中1 1 1 1
5、表示表示表示表示最喜欢的,最喜欢的,最喜欢的,最喜欢的,4 4 4 4表示最不喜欢的。表示最不喜欢的。表示最不喜欢的。表示最不喜欢的。永久、凤凰、飞鸽、金狮永久、凤凰、飞鸽、金狮 特点:特点:两个数字之间的差距没有绝对的意义。两个数字之间的差距没有绝对的意义。等距量表等距量表n n等距量表是指各点之间具有相同的间距以显示相等距量表是指各点之间具有相同的间距以显示相等距量表是指各点之间具有相同的间距以显示相等距量表是指各点之间具有相同的间距以显示相对数量对数量对数量对数量。(温度)使用等距量表,调查人员可以。(温度)使用等距量表,调查人员可以。(温度)使用等距量表,调查人员可以。(温度)使用等距
6、量表,调查人员可以研究两个目标对象之间的差距。研究两个目标对象之间的差距。研究两个目标对象之间的差距。研究两个目标对象之间的差距。n n等距量表是一类连续的数量,因此,它在等级之等距量表是一类连续的数量,因此,它在等级之等距量表是一类连续的数量,因此,它在等级之等距量表是一类连续的数量,因此,它在等级之间是有程度的差异的;等级之间的差距相等,各间是有程度的差异的;等级之间的差距相等,各间是有程度的差异的;等级之间的差距相等,各间是有程度的差异的;等级之间的差距相等,各点之间能进行加减,不能进行乘除。点之间能进行加减,不能进行乘除。点之间能进行加减,不能进行乘除。点之间能进行加减,不能进行乘除。
7、n n如:对自行车品牌满意度打分,最高分是如:对自行车品牌满意度打分,最高分是如:对自行车品牌满意度打分,最高分是如:对自行车品牌满意度打分,最高分是10101010分,分,分,分,最低分是分。如果给永久分,金狮分,那最低分是分。如果给永久分,金狮分,那最低分是分。如果给永久分,金狮分,那最低分是分。如果给永久分,金狮分,那么我们可以说永久比金狮多分,但我们不能说么我们可以说永久比金狮多分,但我们不能说么我们可以说永久比金狮多分,但我们不能说么我们可以说永久比金狮多分,但我们不能说永久得分是金狮得分的倍。永久得分是金狮得分的倍。永久得分是金狮得分的倍。永久得分是金狮得分的倍。等比量表等比量表n
8、 n等比量表可以对变量的实际数值进行比较的量表,等比量表可以对变量的实际数值进行比较的量表,等比量表可以对变量的实际数值进行比较的量表,等比量表可以对变量的实际数值进行比较的量表,是测量数据中最高水平的量表,可以进行分类、是测量数据中最高水平的量表,可以进行分类、是测量数据中最高水平的量表,可以进行分类、是测量数据中最高水平的量表,可以进行分类、排序、加、减、乘、除等运算。排序、加、减、乘、除等运算。排序、加、减、乘、除等运算。排序、加、减、乘、除等运算。应答者的物理特应答者的物理特应答者的物理特应答者的物理特性,如体重、身高、年龄等都是等比量表的例子。性,如体重、身高、年龄等都是等比量表的例
9、子。性,如体重、身高、年龄等都是等比量表的例子。性,如体重、身高、年龄等都是等比量表的例子。n n如:如:如:如:A A A A、B B B B两个商店的年销售额分别为两个商店的年销售额分别为两个商店的年销售额分别为两个商店的年销售额分别为800800800800万元和万元和万元和万元和400400400400万元,我们不但可以说万元,我们不但可以说万元,我们不但可以说万元,我们不但可以说A A A A商店的年销售额比商店的年销售额比商店的年销售额比商店的年销售额比B B B B商商商商店的年销售额高出店的年销售额高出店的年销售额高出店的年销售额高出400400400400万元,而且还可以说万
10、元,而且还可以说万元,而且还可以说万元,而且还可以说A A A A商店商店商店商店的年销售额是的年销售额是的年销售额是的年销售额是B B B B商店的倍,反映了两个商店年销商店的倍,反映了两个商店年销商店的倍,反映了两个商店年销商店的倍,反映了两个商店年销售额相差的相对程度。售额相差的相对程度。售额相差的相对程度。售额相差的相对程度。四种量表比较四种量表比较定类定类定类定类测量测量测量测量定序定序定序定序测量测量测量测量定距定距定距定距测量测量测量测量定比定比定比定比测量测量测量测量类别区分(类别区分(类别区分(类别区分(、=)次序区分(次序区分(次序区分(次序区分(、)距离区分(、)距离区分
11、(、)距离区分(、)距离区分(、)比例区分(、比例区分(、比例区分(、比例区分(、)有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有有三、里克特(Likert)量表qq这是现代调查研究中被普遍采用的一种测量量表这是现代调查研究中被普遍采用的一种测量量表这是现代调查研究中被普遍采用的一种测量量表这是现代调查研究中被普遍采用的一种测量量表qq它它它它的的的的基基基基本本本本形形形形式式式式是是是是给给给给出出出出一一一一组组组组陈陈陈陈述述述述,这这这这些些些些陈陈陈陈述述述述都都都都与与与与某某某某人人人人对对对对某某某某个个个个单单单单独独独独事事事事物物物物的的
12、的的态态态态度度度度有有有有关关关关(例例例例如如如如,对对对对某某某某个个个个教教教教学学学学软软软软件件件件教教教教学学学学效效效效果果果果所所所所持持持持的的的的态态态态度度度度),要求受试者对陈述作出回答。,要求受试者对陈述作出回答。,要求受试者对陈述作出回答。,要求受试者对陈述作出回答。qq对对对对每每每每种种种种回回回回答答答答都都都都要要要要赋赋赋赋一一一一个个个个数数数数值值值值。对对对对肯肯肯肯定定定定式式式式陈陈陈陈述述述述,选选选选择择择择“完完完完全全全全同同同同意意意意”的赋值为的赋值为的赋值为的赋值为5 5 5 5,“同意同意同意同意”的为的为的为的为4 4 4 4
13、等等。等等。等等。等等。远程教育学习资源类型远程教育学习资源类型远程教育学习资源类型远程教育学习资源类型 对资源的评定对资源的评定对资源的评定对资源的评定 极多极多极多极多 较多较多较多较多 较少较少较少较少 极少极少极少极少 (1 1 1 1)直播录像听课)直播录像听课)直播录像听课)直播录像听课 使用频率使用频率使用频率使用频率 发挥作用发挥作用发挥作用发挥作用 (2 2 2 2)网上教学课件)网上教学课件)网上教学课件)网上教学课件使用频率使用频率使用频率使用频率 发挥作用发挥作用发挥作用发挥作用 (3 3 3 3)多媒体教学光盘)多媒体教学光盘)多媒体教学光盘)多媒体教学光盘 使用频率
14、使用频率使用频率使用频率 发挥作用发挥作用发挥作用发挥作用 (4 4 4 4)双向视频会议答疑)双向视频会议答疑)双向视频会议答疑)双向视频会议答疑 使用频率使用频率使用频率使用频率 发挥作用发挥作用发挥作用发挥作用 (5 5 5 5)访问互联网上的相)访问互联网上的相)访问互联网上的相)访问互联网上的相关站点关站点关站点关站点 使用频率使用频率使用频率使用频率 发挥作用发挥作用发挥作用发挥作用 四、语意差别量表n n语语语语意意意意差差差差别别别别测测测测量量量量是是是是针针针针对对对对某某某某个个个个概概概概念念念念设设设设计计计计出出出出一一一一系系系系列列列列双双双双向向向向形形形形容
15、容容容词词词词量量量量表表表表,请请请请被被被被测测测测者者者者根根根根据据据据对对对对词词词词或或或或概概概概念念念念的的的的感感感感受受受受、理解,在量表上选定相应的位置。理解,在量表上选定相应的位置。理解,在量表上选定相应的位置。理解,在量表上选定相应的位置。你认为通过网络资源进行学习你认为通过网络资源进行学习你认为通过网络资源进行学习你认为通过网络资源进行学习正向正向正向正向2 21 10 0-1-1-2-2反向反向反向反向自主的自主的自主的自主的受控的受控的受控的受控的愉快化的愉快化的愉快化的愉快化的不愉快的不愉快的不愉快的不愉快的创造性的创造性的创造性的创造性的传统的传统的传统的传
16、统的有帮助的有帮助的有帮助的有帮助的无帮助的无帮助的无帮助的无帮助的刺激的刺激的刺激的刺激的无味的无味的无味的无味的有益的有益的有益的有益的无益的无益的无益的无益的令人兴奋的令人兴奋的令人兴奋的令人兴奋的单调的单调的单调的单调的有趣的有趣的有趣的有趣的枯燥的枯燥的枯燥的枯燥的富于变化的富于变化的富于变化的富于变化的老一套的老一套的老一套的老一套的案例案例7 6 5 4 3 2 1价格昂贵价格昂贵价格昂贵价格昂贵 价格便宜价格便宜价格便宜价格便宜鲜花品种多鲜花品种多鲜花品种多鲜花品种多 品种少品种少品种少品种少售后服务好售后服务好售后服务好售后服务好 服务差服务差服务差服务差交通方便交通方便交通
17、方便交通方便 交通不便交通不便交通不便交通不便店面布置新颖店面布置新颖店面布置新颖店面布置新颖 陈旧陈旧陈旧陈旧A A店:白线条店:白线条店:白线条店:白线条B B店:黄线条店:黄线条店:黄线条店:黄线条受访者评价受访者评价A A、B B两鲜花店的情况两鲜花店的情况第二节第二节 统计分析概述统计分析概述 一、统计分析的作用二、单变量统计分析一、统计分析的作用一、统计分析的作用(一)对数据资料进行简化和描述 百分比、均值、方差、标准差百分比、均值、方差、标准差(二)(二)探寻变量之间复杂的相互关系(三)统计推论 二、单变量统计分析二、单变量统计分析1、变量分布2统计表与统计图3集中趋势测量法 4
18、离中趋势测量法5.正态分布与标准值1、变量分布、变量分布n n一个变量的全部分数或观察值组成的一组或一批数据可以称为一个分布,考察的是该变量的不同情况出现的次数。频数分布频数分布n n频数分布,又称频次分布、次数分布,是原始资频数分布,又称频次分布、次数分布,是原始资料中变量的每一个取值出现的次数。料中变量的每一个取值出现的次数。频率分布频率分布 n n频率分布是一组数据中不同取值的频数相对于总频率分布是一组数据中不同取值的频数相对于总数的比率分布情况,即用变量每一取值的频数除数的比率分布情况,即用变量每一取值的频数除以总个案数,常以频率分布表的形式来表达。以总个案数,常以频率分布表的形式来表
19、达。分组的变量分布:n n假设我们调查了假设我们调查了4040名订阅报刊的读者,他们每年在名订阅报刊的读者,他们每年在订阅报刊方面的支出情况如下所示(单位:元)。订阅报刊方面的支出情况如下所示(单位:元)。n n将上述资料按数值大小重新排列为:n n经过初步整理可以看出,读者订阅报刊的支出在经过初步整理可以看出,读者订阅报刊的支出在5656元至元至9999元乏间波动。因为支出金额属于元乏间波动。因为支出金额属于连续型定比变量连续型定比变量,如果直,如果直接以频数分布表的形式进行统计,表格会变得十分冗长而接以频数分布表的形式进行统计,表格会变得十分冗长而且毫无意义,因此需要对取值范围进行适当分组
20、。且毫无意义,因此需要对取值范围进行适当分组。相关概念相关概念:组:组上下限、组中上下限、组中值、累计频数值、累计频数和累计百分比和累计百分比 。Frequency()2 2统计表与统计图统计表与统计图n n统计表 统计图统计图 (1)(1)条形图柱状图:用长条的长度或高度来表示数条形图柱状图:用长条的长度或高度来表示数量多少的统计图形。量多少的统计图形。(2)(2)圆瓣图:圆瓣图也称为饼形图、扇形图,适用于圆瓣图:圆瓣图也称为饼形图、扇形图,适用于描述数据之间的比例分配关系。描述数据之间的比例分配关系。n n根据研究的需要,还可以对圆瓣图进行调整,使根据研究的需要,还可以对圆瓣图进行调整,使
21、之由平面图形变成三维立体图形。之由平面图形变成三维立体图形。n n(3)(3)直方图:直方图是用长条的宽度和高度来表示直方图:直方图是用长条的宽度和高度来表示频数或频率分布的图形。频数或频率分布的图形。(4 4)折线图:以折现的上升或下降来表示统计数量)折线图:以折现的上升或下降来表示统计数量增减变化的统计图,叫做折线图。增减变化的统计图,叫做折线图。3集中趋势测量法集中趋势测量法 n n集中趋势测量法是从一组数据中抽象出一个代表值,代表现象的共性和一般水平。常用的表示数据集中趋势的统计量包括众数、中位值、均值。众数众数(mode)n n所谓众数就是一组数据中出现频数最多的那个变所谓众数就是一
22、组数据中出现频数最多的那个变量值,用量值,用MoMo表示。简单地说就是一组数据中占比表示。简单地说就是一组数据中占比例最大的那个数。例最大的那个数。MODE()()中位数(median)n n将一组数据按照大小排序之后,处在最中间位置的将一组数据按照大小排序之后,处在最中间位置的一个数据(或最中间两个数据的均值)叫做这组数一个数据(或最中间两个数据的均值)叫做这组数据的中位数。(据的中位数。(MMd d)n n当数据个数为奇数时,中位数就是这组数据中的当数据个数为奇数时,中位数就是这组数据中的一个数据,其位置为一个数据,其位置为(n+1)/2(n+1)/2。n n假设某次调查得到假设某次调查得
23、到5 5个原始数据分别是:个原始数据分别是:24,22,21,26,20n n将数据按照从小到大重新排列,则数据呈现为:20,21,22,24,26n n当数据个数为偶数时,中位数是一个假设的数,其值为最当数据个数为偶数时,中位数是一个假设的数,其值为最中间两个数据的均值,在中间两个数据的均值,在n/2n/2和号和号n/2+1n/2+1之间。此时,中位之间。此时,中位数不一定与这组数据中的某个数据相等。假设某次调查得数不一定与这组数据中的某个数据相等。假设某次调查得到到6 6个原始数据分别是:个原始数据分别是:10 10,5 5,9 9,1212,6 6,8 8n n同样首先需要将数据按照从小
24、到大的顺序重新排同样首先需要将数据按照从小到大的顺序重新排列,则数据呈现为:列,则数据呈现为:5 5,6 6,8 8,9 9,1010,1212 8.5 8.5 中位数是(中位数是(8+98+9)/2=8.5/2=8.5 均值(mean)n n均值,又称平均数,适用于定距及定比变量,是使用得最多的集中趋势统计量。(1)(1)对于未经分组整理的原始数据,均值的计算相对对于未经分组整理的原始数据,均值的计算相对简单,设变量的取值分别为简单,设变量的取值分别为X1X1、X2 X2、X3X3、XnXn,则均值的计算公式可以用统计符号表示为:则均值的计算公式可以用统计符号表示为:(2 2)如果样本的数据
25、很多,达到数百个甚至更多,)如果样本的数据很多,达到数百个甚至更多,需要利用频数分布表求均值。需要利用频数分布表求均值。公式中Xi为各组的组中值,f为各组的频数,n为总个案数。4离中趋势测量法n n离中趋势,也称为离散趋势。反映的是一组数据离中趋势,也称为离散趋势。反映的是一组数据中各观察值之间的差异或离散程度。离中趋势测中各观察值之间的差异或离散程度。离中趋势测量法与集中趋势测量法具有互相补充的作用,从量法与集中趋势测量法具有互相补充的作用,从另一个侧面反映了集中趋势统计量的代表程度。另一个侧面反映了集中趋势统计量的代表程度。一组数据的离中程度越大,则集中趋势的代表性一组数据的离中程度越大,
26、则集中趋势的代表性就越小;离中程度越小,则集中趋势的代表性就就越小;离中程度越小,则集中趋势的代表性就越大。常用的离中趋势统计量有越大。常用的离中趋势统计量有异众比率异众比率、极差、极差、方差方差和和标准差标准差。异众比率(variation ratio)n n异众比率是指非众数的各变量值的频数占总频数异众比率是指非众数的各变量值的频数占总频数的比率,在于表明总体中众数不能代表的那一部的比率,在于表明总体中众数不能代表的那一部分单位所占的比重。分单位所占的比重。n为变量值的总频数;fmo为众数组的频数。当V接近于1时,表示数据分布十分分散,众数几乎没有代表性。n n假设随机调查了假设随机调查了
27、200200个市民购买报纸的情况,数据个市民购买报纸的情况,数据如表如表2-82-8所示。所示。在调查的200个市民中,购买广州日报的人最多,广州日报即为报纸类型的众数。根据公式计算可得:极差(range)n n极差,又称全距,是对定序以上层次变量分散程极差,又称全距,是对定序以上层次变量分散程度的度量,是描述数据分布离散程度最简单的统度的度量,是描述数据分布离散程度最简单的统计量。计量。极差极差(R)=观察的最大值一观察的最小值观察的最大值一观察的最小值MAX()-MIN()方差和标准差(vanance and standard deviation)5.正态分布正态分布n n概念:指变量的频
28、数或频率呈中间最多,两端 逐渐对称地减少,表现为钟形的一种概率分布。从理论上说,若随机变量x的概率密度函数为:则称则称x服从均数为服从均数为,标准差为,标准差为的正态分布。的正态分布。正态分布的特征:正态分布的特征:正态分布的特征:正态分布的特征:(1)以X=为中心为中心,X,X值呈钟型分布对称性值呈钟型分布对称性减少。减少。(2)在 X=处,f(x)取最大值。(3)正态分布正态分布由、决定正态分布的位置决定正态分布的位置和形状。和形状。随随不同,曲线位置不同,称不同,曲线位置不同,称为为位置位置参数。参数。越大越大,曲线形状不同曲线形状不同,称称为形状为形状参数。参数。标准差相同、均数不同的
29、正态分布曲线标准差相同、均数不同的正态分布曲线均数相同、标准差不同的正态分布曲线均数相同、标准差不同的正态分布曲线正态曲线下面积的分布规律正态曲线下面积的分布规律n n正态曲线下面积的意义:n n 1.表示变量值(表示变量值(x)在)在a-b区间变量值所占全区间变量值所占全部(总体)变量值的部(总体)变量值的比例或概率比例或概率(p)。n n2.变量值在整个曲线下的面积为变量值在整个曲线下的面积为100%,或出或出现的概率为现的概率为1。n n3.曲线下从均值到任何数量的标准差单位之曲线下从均值到任何数量的标准差单位之间的面积,占曲线下面积的比例是一定的。间的面积,占曲线下面积的比例是一定的。
30、正态分布曲线下的面积正态分布曲线下的面积 范围内的面积为范围内的面积为68.27%1.96范围内的面积为范围内的面积为95%2.58范围内的面积占范围内的面积占99%标准正态分布及应用标准正态分布及应用n n标准正态分布:指均数为0,标准差为1的正态分布。常称z 分布。n n标准正态分布与正态分布的转换公式:n n即若即若x服从正态分布服从正态分布N(,2),),则则z就服就服从从均数为均数为0,标准差为标准差为1的正态分布。的正态分布。正态分布的应用正态分布的应用n例:有480个学生,量身高。他们的正态分布的平均数是170cm。他们的标准偏差是12。百分之多少的人身高在158 cm以下?答案
31、:Z=(158-170)/12-11-(1)1-0.8413450.15865515.86所以15.86的人身高在158以下。EXCEL里绘制正态分布曲线里绘制正态分布曲线三、假设检验三、假设检验n n概念:概念:从对总体参数所做的一个假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上是可靠的,并做出承认还是拒绝该假设的判断。n n假设检验的步骤假设检验的步骤n n提出提出原假设原假设和和备择假设备择假设n n确定适当的确定适当的检验统计量检验统计量n n规定规定显著性水平显著性水平n n计算检验统计量的值计算检验统计量的值n n作出作出统计决策统计决
32、策双侧检验和单侧检验双侧检验和单侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式假设的形式)假设假设假设假设研究的问题研究的问题研究的问题研究的问题双侧检验双侧检验双侧检验双侧检验左侧检验左侧检验左侧检验左侧检验右侧检验右侧检验右侧检验右侧检验HH0 0=0 0 0 0 0 0HH1 1 0 0 0 0双侧检验双侧检验(例子)(例子)该企业生产的零件平均长度是该企业生产的零件平均长度是4厘米吗厘米吗?(属于决策中的假设)n n提出原假设:H0:=4n n提出备择假设:H1:4双侧检验双侧检验(显著性水平与拒绝域(显著性水平与拒绝域)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH
33、000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平双侧检验双侧检验(显著性水平与拒绝域(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平双侧检验双侧检验(显著性水平与拒绝域(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝
34、域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平双侧检验双侧检验(显著性水平与拒绝域(显著性水平与拒绝域 )H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平单侧检验单侧检验(原假设与备择假设的确定)(原假设与备择假设的确定)n n 检验检验研究中的假设研究中的假设1.将所研究的假设作为备择假设H12.将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设。3.先确立备
35、择假设H1单侧检验单侧检验(例子)(例子)n n该批产品的平均使用寿命超过该批产品的平均使用寿命超过1000小时吗小时吗?n n (属于检验声明的有效性,先提出原假设)n n提出原假设:H0:1000n n选择备择假设:H1:1020 1020n n =0.050.05n nn n =1616n n临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域0.050.051.
36、6451.645课堂练习课堂练习n n某校利用一套能力测试题测验本校初二学生,平均成绩为48分,标准差为6分,期中初二年级二班参加测验49人,平均成绩51分,问二班学生的能力测试成绩是否高于年级的平均成绩?(取 =0.01)n n 什么是原假设?什么是原假设?(Null Hypothesis)n n1.待检验的假设,又称“0假设”n n2.如果错误地作出决策会导致一系列后果n n3.总是有等号总是有等号 ,或或 n n4.表示为 H0n nH H0 0:某一数值某一数值 n n指定为指定为=号,即号,即 或或 n n例如例如,H,H0 0:3190 3190(克)(克)n n什么是备择假设?什
37、么是备择假设?(Alternative Hypothesis)n n1.与原假设对立的假设n n2.总是有不等号:,或 n n3.表示为 H1n nH1:某一数值,或 某一数值n n例如,H1:3910(克),或3910(克)n n什么检验统计量?什么检验统计量?n n1.用于假设检验问题的统计量n n2.选择统计量的方法与参数估计相同,需考虑n n是大样本还是小样本是大样本还是小样本n n总体方差已知还是未知总体方差已知还是未知n n3.检验统计量的基本形式为规定显著性水平规定显著性水平 n n 什么显著性水平?什么显著性水平?n n1.是一个概率值n n2.原假设为真时,拒绝原假设的概率n n被称为抽样分布的拒绝域被称为抽样分布的拒绝域n n3.表示为(alpha)n n常用的常用的 值有值有0.01,0.05,0.100.01,0.05,0.10n n4.由研究者事先确定作出统计决策作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值Z或Z /23.将检验统计量的值与水平的临界值进行比较4.得出接受或拒绝原假设的结论
限制150内