(本科)[2]第二章统计学的范畴、方法论、量化尺度与试验设计《统计学》(第二版)ppt课件.ppt
-
资源ID:15303895
资源大小:1.49MB
全文页数:30页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(本科)[2]第二章统计学的范畴、方法论、量化尺度与试验设计《统计学》(第二版)ppt课件.ppt
课程主讲人:2第二章 统计学的范畴、方法论、量化尺度与试验设计统计学(第二版)第二章第二章 统计学的范畴、方法论、统计学的范畴、方法论、 量化尺度与试验设计量化尺度与试验设计Chapter 2 Category, Methodology, Quantitative Scale and Experimental Design of Statistics第一节第一节 统计学的基本范畴统计学的基本范畴 范畴是人们对客观事物不同侧面进行归纳分析而范畴是人们对客观事物不同侧面进行归纳分析而得出的基本概念。掌握范畴便于认识现象的本质。统得出的基本概念。掌握范畴便于认识现象的本质。统计学的基本范畴主要有统计总体、总体单位、标志、计学的基本范畴主要有统计总体、总体单位、标志、指标等。指标等。 一、统计总体与总体单位一、统计总体与总体单位 统计总体,简称总体或母体,它是至少有一个相统计总体,简称总体或母体,它是至少有一个相同主要性质的众多个体组成的集合体。总体单位是构同主要性质的众多个体组成的集合体。总体单位是构成总体的个体。统计认识是从总体单位开始,但是又成总体的个体。统计认识是从总体单位开始,但是又不能停留在个别现象上,必须由个体过渡到总体,通不能停留在个别现象上,必须由个体过渡到总体,通过大量个体的综合得到总体,以显现现象的数量特征。过大量个体的综合得到总体,以显现现象的数量特征。构成总体的所有单位至少要有一个主要属性相同,这构成总体的所有单位至少要有一个主要属性相同,这是组成总体的前提条件。比如,全国人口普查,构成是组成总体的前提条件。比如,全国人口普查,构成总体的主要属性是具有中国国籍且常住在中国境内。总体的主要属性是具有中国国籍且常住在中国境内。因此,总体必然为同质性总体,同质性是构成统计总因此,总体必然为同质性总体,同质性是构成统计总体的基础。体的基础。 按照总体单位的形态划分,可将总体分为实体总按照总体单位的形态划分,可将总体分为实体总体和行为总体。实体总体是以某种客观存在的实体单体和行为总体。实体总体是以某种客观存在的实体单位构成的总体,如:以人、企业、商品等个体单位组位构成的总体,如:以人、企业、商品等个体单位组成的总体;行为总体是以某种事件行为为单位构成的成的总体;行为总体是以某种事件行为为单位构成的总体,如:以投机行为、犯罪行为、道德行为等个体总体,如:以投机行为、犯罪行为、道德行为等个体单位组成的总体。单位组成的总体。 总体和总体单位是相对而言的,随着研究目的的总体和总体单位是相对而言的,随着研究目的的不同,总体和总体单位可以相互转化。比如:全国工不同,总体和总体单位可以相互转化。比如:全国工业普查,工业部门所有工业企业是总体,而每一个工业普查,工业部门所有工业企业是总体,而每一个工业企业是总体单位。若专门抽选某一个企业典型调查业企业是总体单位。若专门抽选某一个企业典型调查它的设备利用情况,则此时企业充当的是总体,每一它的设备利用情况,则此时企业充当的是总体,每一台设备则为总体单位。台设备则为总体单位。 二、标志、变量和指标二、标志、变量和指标 (一)标志(一)标志 它是反映总体单位的属性或特征。换而言之,总它是反映总体单位的属性或特征。换而言之,总体单位是标志的载体,即标志的承担者。标志是统计体单位是标志的载体,即标志的承担者。标志是统计认识的起点。认识的起点。 按标志是否可以用数量表现划分,分为品质标志按标志是否可以用数量表现划分,分为品质标志和数量标志。品质标志是指不能用数量表现而只能用和数量标志。品质标志是指不能用数量表现而只能用文字、符号或代码说明的标志,如:人的性别、文化文字、符号或代码说明的标志,如:人的性别、文化程度、工种等;数量标志是指能用数量表现的标志,程度、工种等;数量标志是指能用数量表现的标志,如:人的年龄、工人工资、工业产值等。凡是反映品如:人的年龄、工人工资、工业产值等。凡是反映品质标志单位组成的总体称为属性总体;凡是反映数量质标志单位组成的总体称为属性总体;凡是反映数量标志组成的总体成为变量总体。标志组成的总体成为变量总体。 按标志是否变异划分,分为不变标志和可变标志。按标志是否变异划分,分为不变标志和可变标志。不变标志是指在同一总体各单位的表现都相同的标志,不变标志是指在同一总体各单位的表现都相同的标志,如:每位女生都县有如:每位女生都县有“女性女性”这个不变标志;可变标这个不变标志;可变标志是指在同一总体各单位的表现不尽相同的标志,志是指在同一总体各单位的表现不尽相同的标志, 如:每位男生的如:每位男生的“年龄年龄”不尽相同,都表现出差异。不尽相同,都表现出差异。 标志表现是标志的实际体现,它分为品质标志表标志表现是标志的实际体现,它分为品质标志表现和数量标志表现。品质标志表现只能用文字描述,现和数量标志表现。品质标志表现只能用文字描述,换句话说,品质标志表现出来的是文字,如:换句话说,品质标志表现出来的是文字,如:“性别性别”是品质标志,其表现有男性和女性。数量标志表现需是品质标志,其表现有男性和女性。数量标志表现需要用数值反映,如:要用数值反映,如:“年龄年龄”是数量标志,其表现有是数量标志,其表现有1010岁、岁、1212岁,岁,8080岁等。换句话说,数量标志表现岁等。换句话说,数量标志表现出来出来的是标志值。的是标志值。 (二)变量(二)变量 将可变的数量标志抽象化就称其为变量,其取值将可变的数量标志抽象化就称其为变量,其取值称为变量值或标志值。变量分为确定性变量和随机变称为变量值或标志值。变量分为确定性变量和随机变量。确定性变量是指受必然性因素的作用,各变量值量。确定性变量是指受必然性因素的作用,各变量值呈现出上升或下降唯一方向性变动的变量,比如:物呈现出上升或下降唯一方向性变动的变量,比如:物品价格变量(品价格变量( )受到销售量因素影响而呈现有规则)受到销售量因素影响而呈现有规则x 变动;随机变量是指受偶然性因素的作用,变量值呈变动;随机变量是指受偶然性因素的作用,变量值呈现出随机游走或混沌状态变动的变量,比如:股票价现出随机游走或混沌状态变动的变量,比如:股票价格变量(格变量( )受到股民投机欲望因素影响而呈现无规则)受到股民投机欲望因素影响而呈现无规则涨跌。涨跌。 根据变量的取值是否连续划分,分为连续型变量根据变量的取值是否连续划分,分为连续型变量和离散型变量。连续型变量是指在一个取值区间内可和离散型变量。连续型变量是指在一个取值区间内可取到无穷多个值,如:身高、体重、元件使用寿命等。取到无穷多个值,如:身高、体重、元件使用寿命等。连续型变量值要用测量或计算的方法取得。离散型变连续型变量值要用测量或计算的方法取得。离散型变量是指在一个取值区间内变量仅可取到有限可列个值,量是指在一个取值区间内变量仅可取到有限可列个值,如:人数、车辆数等。离散型变量值只能用计数的方如:人数、车辆数等。离散型变量值只能用计数的方法取得。法取得。x (三)指标(三)指标 它是反映总体数量特征及其范畴的。换而言之,它是反映总体数量特征及其范畴的。换而言之,总体是指标的载体,即为指标的承担者。指标是统计总体是指标的载体,即为指标的承担者。指标是统计认识的工具。认识的工具。 按指标所反映的数量性质不同划分,分为数量指按指标所反映的数量性质不同划分,分为数量指标和质量指标。数量指标是指反映总体绝对规模和水标和质量指标。数量指标是指反映总体绝对规模和水平,体现事物广度的外延指标,如平,体现事物广度的外延指标,如:20122012年我国年我国GDPGDP为为519322519322亿元;亿元;20122012年末中国大陆总人口年末中国大陆总人口135404135404万人,万人,净增净增669669万人,国家外汇储备万人,国家外汇储备3311633116亿美元。质量指标亿美元。质量指标是指反映总体相对程度,体现事物深度的内涵指标,是指反映总体相对程度,体现事物深度的内涵指标,如:如:20122012年我国年我国GDPGDP增长率为增长率为7.8%7.8%,居民消费价格指数,居民消费价格指数(CPI)上涨)上涨2.6%2.6%,粮食产量增幅,粮食产量增幅3.2%3.2%。数量指标是。数量指标是用绝对数表示的,质量指标是用相对数用绝对数表示的,质量指标是用相对数或平均数表示或平均数表示的。质量指标是数量指标的派生指标。的。质量指标是数量指标的派生指标。 由此可知,一个完整的统计指标是由指标概念与指由此可知,一个完整的统计指标是由指标概念与指标数值两个要素构成。指标概念反映了现象的质的规标数值两个要素构成。指标概念反映了现象的质的规定性;指标数值反映了现象的量的规定性。定性;指标数值反映了现象的量的规定性。 综上所述,标志和指标既有区别又有联系。综上所述,标志和指标既有区别又有联系。 二者区别。标志是反映总体单位的属性和特征,二者区别。标志是反映总体单位的属性和特征,它未必都可量;指标是反映总体的数量特征,它一定它未必都可量;指标是反映总体的数量特征,它一定是可量。是可量。 二者联系。同一总体各单位标志值的综合就得到二者联系。同一总体各单位标志值的综合就得到指标,即所谓的综合指标。由此可见,没有数量标志指标,即所谓的综合指标。由此可见,没有数量标志就没有统计指标。然而,总体与总体单位之间又会发就没有统计指标。然而,总体与总体单位之间又会发生转换,随着研究目的的改变,假如原来作为总体的生转换,随着研究目的的改变,假如原来作为总体的后来充当总体单位,则相应的指标也就变成了标志;后来充当总体单位,则相应的指标也就变成了标志;反之亦然。反之亦然。 第二节第二节 统计方法论统计方法论 统计方法论是关于以大量的数量研究为基础的统统计方法论是关于以大量的数量研究为基础的统计方法的理论。统计运行系统中各子系统有其专门的计方法的理论。统计运行系统中各子系统有其专门的认识方法,而贯穿全系统的统计认识的基本方法主要认识方法,而贯穿全系统的统计认识的基本方法主要有大量观察法、综合分析法和归纳推断法。有大量观察法、综合分析法和归纳推断法。 一、大量观察法一、大量观察法 大量观察法是指对总体中全部或足够多数单位进大量观察法是指对总体中全部或足够多数单位进行观察分析的方法。现象总体受多种因素交互影响,行观察分析的方法。现象总体受多种因素交互影响,其中,既有主要的、必然的因素,又有次要的、偶然其中,既有主要的、必然的因素,又有次要的、偶然因素。若只选取少量单位进行观察,很可能出现刚好因素。若只选取少量单位进行观察,很可能出现刚好是次要的、偶然的因素对这部分单位起支配决定性作是次要的、偶然的因素对这部分单位起支配决定性作用,用这部分单位反映总体特征就会出现虚假现象。用,用这部分单位反映总体特征就会出现虚假现象。若对一个动态现象进行大量观察,则主要的、必然的若对一个动态现象进行大量观察,则主要的、必然的因素支配着现象呈现稳定的单一方向的发展大势,而因素支配着现象呈现稳定的单一方向的发展大势,而次要的、偶然的因素对动态现象发展大势时而产生正次要的、偶然的因素对动态现象发展大势时而产生正作用时而产生反作用的干扰,使得大势中隐含着多个作用时而产生反作用的干扰,使得大势中隐含着多个 起伏的中、小势,如果对整个发展期现象的数量特征起伏的中、小势,如果对整个发展期现象的数量特征值逐期进行综合平均,那么所有次要的、偶然的因素值逐期进行综合平均,那么所有次要的、偶然的因素对现象的作用可以在求和中相互抵消,从而使得现象对现象的作用可以在求和中相互抵消,从而使得现象显示出较平滑的有规则的走势。若对一个静态现象进显示出较平滑的有规则的走势。若对一个静态现象进行大量观察,则同样地个别或少量单位很可能受次要行大量观察,则同样地个别或少量单位很可能受次要的、偶然的因素影响大而出现异常,这种异常包括正、的、偶然的因素影响大而出现异常,这种异常包括正、反两方面的效应。若将大量单位综合,则这部分单位反两方面的效应。若将大量单位综合,则这部分单位因受偶然性因素作用而产生的差异可以相互抵消,从因受偶然性因素作用而产生的差异可以相互抵消,从而显现出集合体的必然的规律性。而显现出集合体的必然的规律性。 由此可以得知,大量观察法的数理依据是概率论中由此可以得知,大量观察法的数理依据是概率论中的大数法则。大数法则是指大量相互独立的随机因素的大数法则。大数法则是指大量相互独立的随机因素构成的总体,如果各个个别因素对总体影响很小,则构成的总体,如果各个个别因素对总体影响很小,则这些个别因素的影响可以相互抵消,而使总体特征,这些个别因素的影响可以相互抵消,而使总体特征,如:频率、平均值,呈现出稳定性。如:频率、平均值,呈现出稳定性。 贝努里大数定律的极限式:贝努里大数定律的极限式: ,此式,此式表明经过表明经过 次大量独立试验观察,最终频率次大量独立试验观察,最终频率 会趋会趋近于一个稳定的概率近于一个稳定的概率 。 正是因为统计是经过大量的个体的概括,从而过正是因为统计是经过大量的个体的概括,从而过渡到稳定的一般的数量特征,所以在一定意义上讲,渡到稳定的一般的数量特征,所以在一定意义上讲,大数规律就是统计规律。大数规律就是统计规律。 二、综合分析法二、综合分析法 综合分析法是指通过大量观察所获得的众多的个综合分析法是指通过大量观察所获得的众多的个体资料,经过整理综合成指标,以反映总体数量特征。体资料,经过整理综合成指标,以反映总体数量特征。在某种程度上讲,一个统计指标便可体现一个统计总在某种程度上讲,一个统计指标便可体现一个统计总体。统计指标都是综合性的,它可以概括性地描述总体。统计指标都是综合性的,它可以概括性地描述总体的综合特征和变动趋势。若对综合指标进行分解和体的综合特征和变动趋势。若对综合指标进行分解和对比,则可以研究总体的差异和数量关系。对比,则可以研究总体的差异和数量关系。 lim(|)1nnPPNNn NP 第三节第三节 统计数据的量化尺度统计数据的量化尺度 量化,又称量标,通常是指概念的操作化或概念量化,又称量标,通常是指概念的操作化或概念的运算化。统计数据的量化既包括指标的量化又包括的运算化。统计数据的量化既包括指标的量化又包括标志的量化。由于社会现象千姿百态,所以,使得有标志的量化。由于社会现象千姿百态,所以,使得有些现象可以直接用计量和测量的方法量化,而有些现些现象可以直接用计量和测量的方法量化,而有些现象却只能间接用计量和测量的方法量化。量化尺度要象却只能间接用计量和测量的方法量化。量化尺度要根据数据所衡量的客观事物的不同特征来确定,因而根据数据所衡量的客观事物的不同特征来确定,因而就需要采用不同的标准尺度来表达现象,以使所研究就需要采用不同的标准尺度来表达现象,以使所研究的对象都能处于量化状态,这就是量化尺度。对客观的对象都能处于量化状态,这就是量化尺度。对客观事物量化的程度不同,则可以将量化尺度从低到高、事物量化的程度不同,则可以将量化尺度从低到高、由粗略到精确地划分为四个层次。由粗略到精确地划分为四个层次。 一、定类尺度一、定类尺度(Nominal level of measurement) 定类尺度是指分组定类尺度是指分组( (或类或类) )排列是依据客观事物的排列是依据客观事物的品质标志进行的,且各组(或类)是并列的平行关系。品质标志进行的,且各组(或类)是并列的平行关系。对定类尺度分析的主要统计量是各组次数占总体的比对定类尺度分析的主要统计量是各组次数占总体的比重或频率。重或频率。 如:中国人口按种族划分为如:中国人口按种族划分为5656个民族,按民族名称首个民族,按民族名称首个字的笔划排列,并列出各民族相应人数和占全国人个字的笔划排列,并列出各民族相应人数和占全国人口比重。口比重。 二、定序尺度二、定序尺度(Ordinal level of measurement) 定序尺度是指事物按照一定大小、优劣、强弱、定序尺度是指事物按照一定大小、优劣、强弱、高低等特征分组,并依序排列,各组不再处于同一水高低等特征分组,并依序排列,各组不再处于同一水平上。对定序尺度分析的主要统计量有频率、众数、平上。对定序尺度分析的主要统计量有频率、众数、中位数、四分位数等。如:医院由最好到一般分级为:中位数、四分位数等。如:医院由最好到一般分级为:特级、三级甲等、三级乙等、三级丙等、二级甲等、特级、三级甲等、三级乙等、三级丙等、二级甲等、二级乙等、二级丙等,等等;考试成绩可以分为优、二级乙等、二级丙等,等等;考试成绩可以分为优、良、中、及格、不及格。这两个例子都是名次靠前的良、中、及格、不及格。这两个例子都是名次靠前的为更优,且组间能比较出优劣或高低。为更优,且组间能比较出优劣或高低。 三、定距尺度三、定距尺度(Interval level of measurement) 定距尺度是指事物以它的客观存在的计量单位作定距尺度是指事物以它的客观存在的计量单位作为分组标志,按照大小、优劣、强弱、高低等标志依为分组标志,按照大小、优劣、强弱、高低等标志依次以一定的间距等距排列。对定距尺度分析的主要统次以一定的间距等距排列。对定距尺度分析的主要统计量有频率、众数、中位数、均值、标准差。如:按计量有频率、众数、中位数、均值、标准差。如:按一段时间的摄氏温度高低排列来测量气温的变化。温一段时间的摄氏温度高低排列来测量气温的变化。温度每提高度每提高1 1度其温度差间距是相同的。由于定距尺度中度其温度差间距是相同的。由于定距尺度中每一组组距是相等的,因此各组同一种标志值能比较每一组组距是相等的,因此各组同一种标志值能比较大小,并且还可以进行加减运算,以显示出彼此差异大小,并且还可以进行加减运算,以显示出彼此差异程度。不过,它不能进行乘除运算,如:可以说温度程度。不过,它不能进行乘除运算,如:可以说温度3333比比1111高高2222,但是不能说前者比后者热,但是不能说前者比后者热3 3倍。定倍。定距尺度没有绝对零点,定距尺度中的距尺度没有绝对零点,定距尺度中的0 0表示表示0 0水平,而水平,而不是不存在或役有。如:某考生入学数学者分为不是不存在或役有。如:某考生入学数学者分为0 0分,分,不等于该生完全没有数学知识;不等于该生完全没有数学知识;00表示冰点温度,并表示冰点温度,并不表示没有温度。不表示没有温度。 四、定比尺度四、定比尺度(Ratio level of measurement) 定比尺度是在定距尺度的基础上还存在可以作为定比尺度是在定距尺度的基础上还存在可以作为比较的共同起点或基数。对定比尺度分析的主要统计比较的共同起点或基数。对定比尺度分析的主要统计量包括前面三种量化尺度所使用的全部统计量。定比量包括前面三种量化尺度所使用的全部统计量。定比尺度的数学性质是既可以作加减运算又可以作乘除运尺度的数学性质是既可以作加减运算又可以作乘除运算。如:甲乡粮食亩产算。如:甲乡粮食亩产500500千克,乙乡粮食亩产千克,乙乡粮食亩产250250千千克,则可以说甲乡比乙乡粮食亩产高一倍。定比尺度克,则可以说甲乡比乙乡粮食亩产高一倍。定比尺度中的原点或基点应是有实际意义的零点,不存在负值,中的原点或基点应是有实际意义的零点,不存在负值,定比尺度中的定比尺度中的0 0表示没有或不存在。比如:一头表示没有或不存在。比如:一头0 0千克千克重的猪,表示这头猪不存在。重的猪,表示这头猪不存在。 总之,搜集数据需要按照上述测量尺度来度量,总之,搜集数据需要按照上述测量尺度来度量,测量尺度决定了数据中蕴涵的信息量。测量尺度决定了数据中蕴涵的信息量。 第四节第四节 试验设计试验设计 统计设计是对整个统计项目的通盘安排,而试验统计设计是对整个统计项目的通盘安排,而试验设计是指通过安排有效的试验力求在有限的试验中获设计是指通过安排有效的试验力求在有限的试验中获得尽可能多的统计信息。试验设计应该严格遵守随机得尽可能多的统计信息。试验设计应该严格遵守随机原则。原则。 一、完全随机化分组设计一、完全随机化分组设计 完全随机化试验是按照完全随机的方式把各种完全随机化试验是按照完全随机的方式把各种“处理处理” (treatment)指派给各个试验单元。试验单指派给各个试验单元。试验单元是指接受处理的实体。完全随机化试验要求总体为元是指接受处理的实体。完全随机化试验要求总体为同质同质(Homogeneous)总体。总体。 通常以等距方式事先确定各组起止号码,从随机通常以等距方式事先确定各组起止号码,从随机数字表(见附表一)中任意确定一数字为起点,沿某数字表(见附表一)中任意确定一数字为起点,沿某一方向搜寻随机数字,对照原定号码进行随机安排。一方向搜寻随机数字,对照原定号码进行随机安排。 范例范例2.1 2.1 有有1818块稻田随机分成三组,每组播不块稻田随机分成三组,每组播不同的种子,即同的种子,即1818个试验单元完全随机地接受三种处理。个试验单元完全随机地接受三种处理。设:设: 甲组:甲组:01060106;乙组:;乙组:07120712;丙组:;丙组:13181318 从随机数字表中第从随机数字表中第9 9行第行第2121列的列的9999开始,向下查询开始,向下查询 介于介于01180118之间的随机数字,数字不允许重复出现,之间的随机数字,数字不允许重复出现,则有:则有: 序号:序号:08 10 07 15 11 02 18 16 03 06 13 14 08 10 07 15 11 02 18 16 03 06 13 14 01 04 05 17 12 0901 04 05 17 12 09 组别:乙组别:乙 乙乙 乙乙 丙丙 乙乙 甲甲 丙丙 丙丙 甲甲 甲甲 丙丙 丙丙 甲甲 甲甲 甲甲 丙丙 乙乙 乙乙 二、配偶组设计二、配偶组设计 为了降低试验误差,提高试验效率,可以预先将为了降低试验误差,提高试验效率,可以预先将试验对象按某一标志配对。配偶组设计分自身配对和试验对象按某一标志配对。配偶组设计分自身配对和同源配对。自身配对是指试验对象自身在试验前后的同源配对。自身配对是指试验对象自身在试验前后的对比;同源配对是指将同性别、同年龄、同体重的试对比;同源配对是指将同性别、同年龄、同体重的试验对象配成对子。验对象配成对子。 三、随机化区组设计三、随机化区组设计 随机化区组设计,又称配伍组设计,它是指组成随机化区组设计,又称配伍组设计,它是指组成配伍组后将各组试验对象随机分配到各个对比组中去。配伍组后将各组试验对象随机分配到各个对比组中去。它是一种限制性随机化试验设计。试验时,先按一定它是一种限制性随机化试验设计。试验时,先按一定规则把试验单元划分为若干同质组,又称规则把试验单元划分为若干同质组,又称“区组区组”,再将各种处理随机地分配给各个区组。再将各种处理随机地分配给各个区组。 范例范例2.2 2.2 为了统计分析小学生的收看电视少儿节为了统计分析小学生的收看电视少儿节目情况,对目情况,对2525名小学生作试验设计,将其分为名小学生作试验设计,将其分为5 5个区组个区组进行进行5 5种处理种处理(“(“处理(处理(treatment)”是试验设计的术是试验设计的术语,表示可控制因索的各个水平语,表示可控制因索的各个水平) )的比较。其步骤为:的比较。其步骤为:首先将多项标志相类似的学生配成首先将多项标志相类似的学生配成5 5个配伍组,然后利个配伍组,然后利用随机数字表将每组的学生重新分配到用随机数字表将每组的学生重新分配到5 5个处理组中去,个处理组中去,构成构成5 5个随机区组个随机区组( (如表如表2-1)2-1)。 任意选定随机数字表第任意选定随机数字表第1010行第行第6 6列列0909作为起点数字,作为起点数字,开始向右连续取出开始向右连续取出2525个随机数字,根抿余数重新分配个随机数字,根抿余数重新分配组。第一个配伍组中,第组。第一个配伍组中,第1 1个余数为个余数为4 4,则第,则第1 1号学生分号学生分配到第四组;第配到第四组;第2 2个余数为个余数为3 3,则在剩下的第一、二、,则在剩下的第一、二、三、五组号中再选出此时列第三位的,即第三组;第三、五组号中再选出此时列第三位的,即第三组;第3 3个余数为个余数为3 3,则在剩下的第一、二、五组号中再选此时,则在剩下的第一、二、五组号中再选此时列第三位的,即第五组;第列第三位的,即第五组;第4 4个余数为个余数为2 2,则在剩下的,则在剩下的第一、二组号中再选此时列第第一、二组号中再选此时列第二二位的,即第位的,即第二二组;最组;最后剩下的第后剩下的第一一组号归第组号归第5 5号学生。其余四个配伍组的学号学生。其余四个配伍组的学生分配方式同理进行。生分配方式同理进行。 表2-1 随机区组随机区组学生编号学生编号随机数字随机数字除数除数 余数余数 分配组列分配组列 1 1 2 2 3 3 4 4 5 5090947472727969654545 54 43 32 2- -4 43 33 32 2- -四四三三五五二二一一 6 6 7 7 8 8 9 91010494917174646090962625 54 43 32 2- -4 41 11 11 1- -四四一一二二三三五五11111212131314141515909052528484777727275 54 43 32 2- -5 54 43 31 1- -五五四四三三一一二二16161717181819192020080802027373434328285 54 43 32 2- -3 32 21 11 1- -三三二二一一四四五五21212222232324242525181818180707929245455 54 43 32 2- -3 32 21 12 2- -三三二二一一五五四四 四、拉丁方设计四、拉丁方设计 拉丁方设计是指行数、列数和处理数三者恒等的拉丁方设计是指行数、列数和处理数三者恒等的平行方阵的设计。当初平行方阵上进行试验时是用拉平行方阵的设计。当初平行方阵上进行试验时是用拉丁字母丁字母A、B、C、D、 表示各种处理,拉丁方设表示各种处理,拉丁方设计因此而得名。每一行是一个区组,每一列也是一个计因此而得名。每一行是一个区组,每一列也是一个区组。在同一行区组和同一列区组内必须且只能包括区组。在同一行区组和同一列区组内必须且只能包括各个处理中的一个小区,不能出现相同的处理。各个处理中的一个小区,不能出现相同的处理。标准标准拉丁方是第一行和第一列的拉丁字母按照自然顺序排拉丁方是第一行和第一列的拉丁字母按照自然顺序排列的的拉丁方。列的的拉丁方。 范例范例2.3 2.3 标准拉丁方和用数字表示的标准拉丁标准拉丁方和用数字表示的标准拉丁 A B C D 1 2 3 4 B A D C 2 1 4 3 C D A B 3 4 1 2 D C B A 4 3 2 1 为了得出试验时用的拉丁方,首先运用随机数字为了得出试验时用的拉丁方,首先运用随机数字表分别调换标准拉丁方行和列的位置。表分别调换标准拉丁方行和列的位置。 若任意选定随机数字表第若任意选定随机数字表第1010行第行第1717列的列的5252作为起作为起点数字,开始向右查寻不大于点数字,开始向右查寻不大于0404的数字,则有的数字,则有02,03, 02,03, 04,0104,01,即,即23412341,相应字母,相应字母BCDA,作为新拉丁方第一,作为新拉丁方第一行。对标准拉丁方作列变换,第二列调至第一列,第行。对标准拉丁方作列变换,第二列调至第一列,第三列调至第二列,第四列调至第三列,第一列调至第三列调至第二列,第四列调至第三列,第一列调至第四列。四列。 B C D A 2 3 4 1 A D C B 1 4 3 2 D A B C 4 1 2 3 C B A D 3 2 1 4 若从随机数字表第若从随机数字表第1414行第行第6 6列交叉处开始向下查寻列交叉处开始向下查寻不大于不大于0404的数字,则有的数字,则有01,03,04,0201,03,04,02,即,即13421342,相应字,相应字母母ACDB,作为新拉丁方第一列。对经过列变换后的,作为新拉丁方第一列。对经过列变换后的拉丁方作行变换,第二行调至第一行,第四行调至第拉丁方作行变换,第二行调至第一行,第四行调至第二行,第一行调至第四行。二行,第一行调至第四行。 A D C B 1 4 3 2 C B A D 3 2 1 4 D A B C 4 1 2 3 B C D A 2 3 4 1 这就是试验所要用的拉丁方,每个字母都表示一这就是试验所要用的拉丁方,每个字母都表示一种处理,每种处理随机地指派给每一个试验小区。种处理,每种处理随机地指派给每一个试验小区。 范例范例2.4 2.4 现在采用以上经过变换获得的拉丁方现在采用以上经过变换获得的拉丁方设计对四种工艺生产的聚脂材料的抗拉强度是否存在设计对四种工艺生产的聚脂材料的抗拉强度是否存在显著性差异进行试验。假如聚脂材料的抗拉强度受到显著性差异进行试验。假如聚脂材料的抗拉强度受到设备和工人技能两种因素的影响,以行区组表示设备和工人技能两种因素的影响,以行区组表示4 4名技名技工的技能,以列区组表示工的技能,以列区组表示4 4台不同的设备,以台不同的设备,以A、B、C、D分别表示四种工艺分别表示四种工艺( (即处理即处理) ),如表,如表2-22-2、表表2-32-3所示。所示。 若任意选定随机数字表第若任意选定随机数字表第2424行第行第1717列的列的4545作为起作为起点数字,开始向左查寻不大于点数字,开始向左查寻不大于0404的数字(注:本题抽的数字(注:本题抽取数字方式,开始时向左查寻,下一行仍然向左查寻,取数字方式,开始时向左查寻,下一行仍然向左查寻,再下一行还是向左查寻,再下一行还是向左查寻,。不过,既然随机取。不过,既然随机取数,开始时向左查寻,下一行也可以向右查寻,再下数,开始时向左查寻,下一行也可以向右查寻,再下一行又向左查寻,一行又向左查寻,。),则有。),则有03,02,04,0103,02,04,01,即,即32413241。 表表2-22-2中,第一行为组中,第一行为组1 1,第二行为组,第二行为组2 2,第三行为,第三行为组组3 3,第四行为组,第四行为组4 4。四组接受。四组接受A、B、C、D四种工艺四种工艺处理,把四种不同工艺按照处理,把四种不同工艺按照32413241顺序排列,即顺序排列,即A=3=3,B=2=2,C=4=4,D=1=1,或者表示为:,或者表示为: 拉丁字母拉丁字母 A B C D 工艺序号工艺序号 3 2 4 13 2 4 1 在拉丁方中,在拉丁方中,A表示第表示第3 3种工艺,种工艺,B表示第表示第2 2种工艺,种工艺,C表示第表示第4 4种工艺,种工艺,D表示第表示第1 1种工艺,从而得到种工艺,从而得到4 44 4拉拉丁方设计,试验模式如表丁方设计,试验模式如表2-22-2所示:所示: 表2-2 聚脂材料抗拉强度拉丁方设计聚脂材料抗拉强度拉丁方设计处理(工艺)处理(工艺)列区组(设备)列区组(设备)行和行和行区组(技工)行区组(技工)A(3) (3) D(1) (1) C(4) (4) B(2)(2)C(4) (4) B(2) (2) A(3) (3) D(1)(1)D(1) (1) A(3) (3) B(2) (2) C(4)(4)B(2) (2) C(4) (4) D(1) (1) A(3)(3) 列和列和 总和总和 备注:圆括号内的数字为所采用的处理工艺序号。备注:圆括号内的数字为所采用的处理工艺序号。 表表2-32-3中,在第中,在第1 1名技工操作第一台设备下,采用第名技工操作第一台设备下,采用第3 3种处理工艺,即种处理工艺,即A工艺处理,得到聚脂材料抗拉强度工艺处理,得到聚脂材料抗拉强度为为2121个单位,个单位,。表2-3 聚脂材料抗拉强度拉丁方设计实验结果聚脂材料抗拉强度拉丁方设计实验结果处理(工艺)处理(工艺)列区组(设备)列区组(设备)行和行和行区组(技工)行区组(技工)A(21) (21) D(17) (17) C(18) (18) B(20)(20)C(15) (15) B(14) (14) A(22) (22) D(19)(19)D(18) (18) A(16) (16) B(20) (20) C(15)(15)B(24) (24) C(16) (16) D(17) (17) A(16)(16) 76 76 70 70 69 69 73 73列和列和 78 63 77 70 78 63 77 70 总和总和 288288备注:圆括号内的数字为每次试验的结果。备注:圆括号内的数字为每次试验的结果。The end of chapterThe end of chapter 2 2