生物统计学复习-课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《生物统计学复习-课件.ppt》由会员分享,可在线阅读,更多相关《生物统计学复习-课件.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物统计学复习生物统计学复习生生生生 的的的的物物物物 基基基基统统统统 本本本本计计计计 内内内内学学学学 容容容容试试试试 验验验验 设设设设 计计计计统统统统 计计计计 分分分分 析析析析基本原则基本原则方案制定方案制定常用试验设计方法常用试验设计方法资料的搜集和整理资料的搜集和整理数据特征数的计算数据特征数的计算统计推断统计推断方差分析方差分析回归和相关分析回归和相关分析对比设计对比设计随机区组设计随机区组设计裂区设计裂区设计拉丁方设计拉丁方设计正交设计正交设计第一章第一章 概论概论总体总体:具有相同性质或属性的个体所组成的集合:具有相同性质或属性的个体所组成的集合个体个体:组成总体的
2、基本单元:组成总体的基本单元样本样本:从总体中抽取的部分观察单位从总体中抽取的部分观察单位变量变量:指相同性质的事物间表现差异性或差异特:指相同性质的事物间表现差异性或差异特征的数据征的数据,表示在一个界限内变动着的性状数值,表示在一个界限内变动着的性状数值常数常数:表示能代表事物特征和性质的数值,通常:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。由变量计算而来,在一定过程中是不变的。参数:参数:描述总体特征的数量描述总体特征的数量统计数:统计数:描述样本特征的数量描述样本特征的数量效应:效应:通过施加试验处理,引起试验差异的作用通过施加试验处理,引起试验差异的作
3、用互作:互作:又叫连应,是指两个或两个以上处理因素又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。间相互作用产生的效应。实验误差:实验误差:实验过程中由于无法控制的因素引起的实验过程中由于无法控制的因素引起的实际观察值与客观真实值之间的差异实际观察值与客观真实值之间的差异系统误差:系统误差:也称也称也称也称片面误差片面误差片面误差片面误差,在实际观测过程中,在实际观测过程中,在实际观测过程中,在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非由受试对象、研究者、仪器设备、研究方法、非由受试对象、研究者、仪器设备、研究方法、非由受试对象、研究者、仪器设备、研究方法、非实验因素
4、影响等固定因素造成的有一定倾向性或实验因素影响等固定因素造成的有一定倾向性或实验因素影响等固定因素造成的有一定倾向性或实验因素影响等固定因素造成的有一定倾向性或规律性的误差。可以通过严格的实验设计和技术规律性的误差。可以通过严格的实验设计和技术规律性的误差。可以通过严格的实验设计和技术规律性的误差。可以通过严格的实验设计和技术措施消除。措施消除。措施消除。措施消除。随机误差:随机误差:试验中受多种无法控制的偶然因素的试验中受多种无法控制的偶然因素的试验中受多种无法控制的偶然因素的试验中受多种无法控制的偶然因素的影响。也称影响。也称影响。也称影响。也称偶然误差偶然误差偶然误差偶然误差。可通过增加
5、抽样或实验次。可通过增加抽样或实验次。可通过增加抽样或实验次。可通过增加抽样或实验次数降低随机误差,但不可避免,但有一定的分布数降低随机误差,但不可避免,但有一定的分布数降低随机误差,但不可避免,但有一定的分布数降低随机误差,但不可避免,但有一定的分布规律,可估计。规律,可估计。规律,可估计。规律,可估计。准确性准确性:也叫准确度,指在调查或试验中某一试:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。验指标或性状的观测值与其真值接近的程度。精确性精确性:也叫精确度,指调查或试验中同一试验:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。指标或
6、性状的重复观测值彼此接近的程度。第二章第二章 试验资料整理与特征数的计算试验资料整理与特征数的计算一、资料的整理(定性描述)一、资料的整理(定性描述)1.数量性状资料数量性状资料 Quantitative data 2.质量性状资料质量性状资料 Qualitative data连续性变异资料连续性变异资料:资料间的变异是连续性的:资料间的变异是连续性的不连续性变异资料不连续性变异资料:观察值只能以整数来表示,:观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连各观察值是不连续的,因此该类资料也称为不连续性变异资料。续性变异资料。质量性状质量性状/属性资料属性资料:只能观察而不能
7、直接测量的:只能观察而不能直接测量的性状,如花的颜色、动物的性别、人的血型、药性状,如花的颜色、动物的性别、人的血型、药物的疗效、植物的抗性等。物的疗效、植物的抗性等。二、资料的整理二、资料的整理定性描述定性描述编制次数编制次数/频数分布表频数分布表全距全距是资料中最大值与最小值之差,又称为是资料中最大值与最小值之差,又称为极差极差(range),用,用R 表示,即表示,即 R=Max(x)-Min(x)每组最大值与最小值之差称为每组最大值与最小值之差称为组距组距,记为,记为 i组距组距(i)全距组数全距组数 组限组限:每个组变量的起止界限,即各组的最大值与每个组变量的起止界限,即各组的最大值
8、与最小值。其中,最小值称为最小值。其中,最小值称为下限下限,最大值称为最大值称为上限上限。组中值组中值:每一组的中点值,是该组的代表值。每一组的中点值,是该组的代表值。组中值与组限、组距的关系组中值与组限、组距的关系如下:如下:组中值组中值(组下限组上限组下限组上限)/2)/2 表号表号 标题标题绘制统计分布图绘制统计分布图条形图条形图(bar chart)直方图直方图(histogram)折线图折线图(broken-line chart),又称,又称多边形图多边形图饼图饼图(pie chart)散点图散点图(scatter chart)统计图绘制的基本要求统计图绘制的基本要求 1、标题简明扼
9、要,列于图的下方。、标题简明扼要,列于图的下方。2、纵、横两轴应有刻度,注明单位。、纵、横两轴应有刻度,注明单位。3、横轴由左至右、纵轴由下而上,数值由小到大;、横轴由左至右、纵轴由下而上,数值由小到大;图形长宽比例约图形长宽比例约5:4或或6:5。4、图中需用不同颜色或线条代表不同事物时,应有、图中需用不同颜色或线条代表不同事物时,应有图例说明。图例说明。变量的分布具有变量的分布具有基本特征基本特征:集中趋势集中趋势(central tendency):(central tendency):变量值集中位置。变量值集中位置。离散趋势离散趋势(tendency of dispersion):(t
10、endency of dispersion):变量值围变量值围绕集中位置的分布情况。绕集中位置的分布情况。特征数特征数可以反映变量分布的性质。可以反映变量分布的性质。二、资料的特征数的计算(定量描述二、资料的特征数的计算(定量描述)(一)集中趋势:平均水平指标(一)集中趋势:平均水平指标(特征数:(特征数:平均数平均数算术平均数算术平均数)(二)离散趋势:变异水平指标(二)离散趋势:变异水平指标(特征数:(特征数:变异数变异数标准差标准差)平均数平均数平均数平均数(averageaverageaverageaverage):是统计学中最常用的统计量,用是统计学中最常用的统计量,用是统计学中最常
11、用的统计量,用是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置,即来表明资料中各观测值相对集中较多的中心位置,即来表明资料中各观测值相对集中较多的中心位置,即来表明资料中各观测值相对集中较多的中心位置,即反映资料的集中趋势。反映资料的集中趋势。反映资料的集中趋势。反映资料的集中趋势。平均数的种类主要有:平均数的种类主要有:平均数的种类主要有:平均数的种类主要有:1.1.1.1.算术平均数(算术平均数(算术平均数(算术平均数(arithmetic meanarithmetic meanarithmetic meanarithmetic mean)2.2.2.2.中位数(中位
12、数(中位数(中位数(medianmedianmedianmedian)3.3.3.3.众数(众数(众数(众数(modemodemodemode)4.4.4.4.几何平均数(几何平均数(几何平均数(几何平均数(geometric meangeometric meangeometric meangeometric mean)1.1.算术平均数算术平均数算术平均数算术平均数是指资料中各观测值的总和除以观测值是指资料中各观测值的总和除以观测值个数所得的商,简称个数所得的商,简称平均数或均数平均数或均数样本平均数样本平均数记为记为平均数的基本性质平均数的基本性质 A.A.样本各观测值与平均数之差的和为零
13、,即样本各观测值与平均数之差的和为零,即离均差离均差之和等于零之和等于零。或简写成或简写成B.B.离均差的平方和最小,即离均差的平方和最小,即02.2.中位数中位数(medianmedian)中位数中位数中位数中位数是将一批数据是将一批数据是将一批数据是将一批数据从小至大排列从小至大排列从小至大排列从小至大排列后,后,后,后,位次居中位次居中位次居中位次居中的数据值,符号为的数据值,符号为的数据值,符号为的数据值,符号为MdMdMdMd,反映一批观察值反映一批观察值反映一批观察值反映一批观察值在位次在位次在位次在位次上的平上的平上的平上的平均水平。均水平。均水平。均水平。1、当观测值个数、当观
14、测值个数n为奇数时,为奇数时,Md=2、当观测值个数为偶数时,、当观测值个数为偶数时,反映数据的反映数据的反映数据的反映数据的离散度离散度离散度离散度(DispersionDispersionDispersionDispersion ),),),),即个体观察值的即个体观察值的即个体观察值的即个体观察值的变异程度变异程度变异程度变异程度。常用的指标有:。常用的指标有:。常用的指标有:。常用的指标有:1.1.1.1.极差极差极差极差(Range(Range(Range(Range)(全距全距全距全距)2.2.2.2.方差方差方差方差 VarianceVarianceVarianceVarianc
15、e 3.3.3.3.标准差标准差标准差标准差Standard DeviationStandard DeviationStandard DeviationStandard Deviation 4.4.4.4.变异系数变异系数变异系数变异系数 Coefficient of VariationCoefficient of VariationCoefficient of VariationCoefficient of Variation全距(极差)全距(极差)是表示资料中各观测值变异是表示资料中各观测值变异程度大小最简便的统计量。程度大小最简便的统计量。各个观测值与平均数的各个观测值与平均数的离均差离
16、均差(x-x-)(x-x-)=0=0离均差平方和即离均差平方和即 ,简称,简称平方和,平方和,记为记为SSSS(sum of square,SSsum of square,SS););离均差平方和的平均数,即离均差平方和的平均数,即方差方差,也称,也称均均方(方(mean square mean square,MSMS)统计学上把样本方差统计学上把样本方差 S S2 2 的算术平方根叫做的算术平方根叫做样本标样本标准差准差,记为,记为S S,即:,即:若若比较两个样本的变异度,则因单位不同或平比较两个样本的变异度,则因单位不同或平均数不同,不能用标准差直接比较。均数不同,不能用标准差直接比较。
17、这时要构造一个不代单位,不受平均数大小影这时要构造一个不代单位,不受平均数大小影响的变异数,这就是变异系数响的变异数,这就是变异系数(coefficient(coefficient of variation)of variation),用,用CVCV表示。表示。第三章第三章 概率与概率分布概率与概率分布1 1、和事件、和事件 事件事件A A和事件和事件B B至少有一个发生构成的新事件称至少有一个发生构成的新事件称为事件为事件A A和事件和事件B B的和事件,记为的和事件,记为A AB B,读作,读作“或或A A发发生,或生,或B B发生发生”。P(A+B)=P(A)+P(B)2、积事件、积事件
18、 事件事件A和和B同时发生而构成的新事件,称为事件同时发生而构成的新事件,称为事件A和和B的积事件,记为的积事件,记为AB,读作,读作“A和和B同时发生或相续同时发生或相续发生发生”。3 3、互斥事件、互斥事件如果事件如果事件A A和和B B不能同时发生,即不能同时发生,即A A和和B B是不可能事件,是不可能事件,则称事件则称事件A A和和B B互斥互斥P(A+B+N)=P(A)+P(B)+P(N)一、事件间的关系一、事件间的关系4、对立事件、对立事件 事件事件A和和B不可能同时发生,但必发生其一,即不可能同时发生,但必发生其一,即AB为必然事件(记为为必然事件(记为ABU),),AB为不可
19、能为不可能事件(记为事件(记为AB=V),则称事件,则称事件B为事件为事件A的对立的对立事件,并记事件,并记B为为5 5、完全事件系、完全事件系 若事件若事件A A1 1、A A2 2、AAn n两两互斥,且每次试验结两两互斥,且每次试验结果必发生其一,则称果必发生其一,则称A A1 1、A A2 2、AAn n为完全事件为完全事件系。系。一、二项分布一、二项分布二、泊松分布二、泊松分布三、正态分布三、正态分布四、四、t t 分布分布五、卡方分布五、卡方分布六、六、F F 分布分布离散型变量离散型变量的概率分布的概率分布连续性变量连续性变量的概率分布的概率分布总体总体分布分布抽样抽样分布分布总
20、体的概率分布总体的概率分布一一.离散型随机变量的概率分布离散型随机变量的概率分布(一)二项分布(一)二项分布P=0.35,n=5的概率分布图1.二项分布的性质和特点二项分布的性质和特点二项分布由二项分布由n n和和p p两个参数决定:两个参数决定:当当p p值较小且值较小且n n不大时,分布是偏倚的。但随着不大时,分布是偏倚的。但随着n n的增的增大大 ,分布逐渐趋于对称,分布逐渐趋于对称当当p p值趋于值趋于 0.5 0.5 时时 ,分布趋于对称,分布趋于对称 即趋于正态分布即趋于正态分布 在在n n 较大,较大,npnp、nqnq 较接近时,二项分布接近于正态较接近时,二项分布接近于正态分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 复习 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内