生物统计复习.pdf
1.和事件 事件 A 和事件 B 至少有一个发生,这一事件称为和事件,记为“A+B”,读作“或 A 发生,或 B 发生”。2.积事件 事件 A 和事件 B 同时发生,这一事件称为积事件,记为“AB”。3.互斥事件(不相容事件)事件 A 和事件 B 不能同时发生,这一事件称为互斥事件,记为“V”4.对立事件 若事件与是互不相容,且为必然事件,则称为的对立事件。5.完全事件系 若事件 A1、A2、A3、An 两两互斥,且每次试验结果必发生其一,则称这 n 个事件为完全事件系。6.事件的独立性 若事件 A 发生与否不影响事件 B 发生的可能性,则称事件 A 和事件 B 相互独立。例如花色与产量无关的例。(一)概率的统计定义 假定在相似条件下重复进行同一类试验,调查事件 A 发生的次数 a 与试验总次数 n 的比数称为频率(a/n),则在试验总次数 n 逐渐增大时,事件 A 的频率愈来愈稳定的接近一个定值 P,则定义为事件 A 发生的概率.记为 P(A)=p=a/n 概率的基本性质:1、任何事件的概率都在 0 与 1 之间,即:0P(A)1 2、必然事件的概率等于 1,即:P(U)=1 3、不可能事件的概率等于 0,即:P(V)=0(二)概率的运算方法 1.加法定理 两个互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 各自的概率之和,既:P(A+B)=P(A)+P(B)2.乘法定理 两个独立事件 A 和 B 的积事件的概率等于事件 A 和事件 B 各自概率的乘积,即:P(AB)=P(A)P(B)3.对立事件的概率 若事件 A 的概率为 P(A),那么对立事件的概率 为:P()=1-P(A)4.完全事件系的概率 若有几个事件 A1,A2,.,An 是试验的完全事件系,则这些事件的概率之和为 1。即:P(A1+A2+An)=P(A1)+P(A2)+(An)=1 1离散型随机变量的概率分布 若随机变量 X 只取数轴上有限个或无限个子孤立 x1,x2,x3xn,并且这些值对应的概 P1,P2,P3Pn:即其概率函数为:PX=xi=pi ,i=1,2,.则称 X 是离散分布的。其中:pi0,pi=1。它的数字特征:表示它的中心位置,方差2 表示它的分散程度或离中趋势。随机变量的数学期望为:=E(X)=xi pi 方差2=V(X)2连续型随机变量的概率分布 如随机变量可取某一(有限或无限)区间内的任何数值,称为连续型随机变量。连续型的随机变量 X 的概率分布用 X 的概率密度函数表示。一、二项分布(属离散型分布)特点:总体 X 只能出现非此即彼两种对立的结果。假定某事件发生的概率为 p,不发生的概率为 q,则做 n 次独立性试验,发生k(0kn)次的概率为:则随机变量 X 服从参数为 n 和 p 的二项分布,记为 XB(n,p).2.二项分布的特点:具有概率分布的一切性质:(1)P(x=k)=Pn(k)0(2)二项分布概率之和等于 1 badxxfbxapba有:对任意,x为连续型随机变量,f(x)称为x的概率密度函数。二项分布由 n 和 P 两个参数决定,其特点是:当 P 值较小且 n 不大时,分布是偏倚的。但随着 n 的增大,分布逐渐趋于对称,如图 31 所示。当 P 值趋于时,分布趋于对称,图 32 所示。对于固定的 n 及 p,当 k 增加时,Pn(k)先随之增加并达到某极大值,以后又下降。3.二项分布的参数 a.二项分布的总体平均数 表示做次独立试验,某事件平均出现的次数为次 b.二项分布的总体方差:2=npq 表示取值的离散度或变异大小 二、泊松分布 泊松分布是一种可以用来描述和分析随机地发生在单位时间或空间里的稀有事件的概率分布。1.泊松分布定义 当某事件出现的概率 p 很小,而试验 n 很大时(n+,p-0,np-时),二项分布B(n,p)的极限分布,即泊松分布,记为 XP()。当二项分布在 p和 np5 时,可用泊松分布近似。2.特点:2 其概率分布条形图的形状决定于。用=np 进行有关计算。三、正态分布、正态分布定义:如果 n-+,xi 无限多,相邻 xi 间的距离无限小,间断性已转变为连续性,其概率函数以转化为 X 的概率密度函数:2、正态分布曲线特点:(1)单峰曲线 (2)左右对称(X)(3)在 x处曲线各有一拐点(4)曲线图形由、确定(5)X ()0(6)曲线与横坐标所夹的面积等于(100)4.正态曲线下的面积:(用概率表示)在统计推断上国内约定 95、99 积分算得,+概率为 95 ,+概率为 99 在统计学上称两尾的概率之和5为 5的显着水准 1为 1的显着水准 5、正态分布的标准化 由于正态分布图形随,不同而变,不便比较,将 X 转化为 u 值:xexfx,21)(2)(21如果随机变量X的概率密度函数满足上式,则称X服从正态分布,记为 2,NX u 称标准正态离差:表示离开平均数有几个标准差单位。标准化正态分布函数:(u)称为标准化正态分布密度函数,即 =0,=1 时的正态分布记作 N(0,1)从 N(,2)到 N(0,1),从几何意义上说,仅仅是将变量 x 作了横坐标轴的平移和尺度单位的变化。抽样分布 统计学的一个主要任务:研究总体和样本之间的的关系.两个方向:(一):由总体到样本,了解从总体到从总体中所抽取样本的变异特点.从总体抽取样本,研究样本分布及其统计数(抽样分布).(二):从样本到总体,即从一个样本或一系列样本的统计数去推断总体.(统计推断)一、统计数的抽样及其分布参数 抽样的类别:1、复置抽样:将抽得的个体放回总体后再继续抽样。2、不复置抽样:将抽得的个体不放回总体后再继续抽样。12212,1:,1,0uuuuupuuuNu内取值的概率为在则标准正态分布的概率计算:xxxu即把原正态分布转化为标准正态分布。22121)(ueu(一)样本平均数的抽样及其分布参数 无限总体:抽样得无限多个随机样本,有限总体:如从容量为N的有限总体抽样,若每次抽取容量 n 的样本可得到N n个样本。并得到N n 个样本平均数,所有的样本平均数集合组成一个新总体。平均数抽样分布,新总体与母总体在特征参数上存在函数关系 生物统计概念 试验方案:根据实验目的和要求所拟定的要进行比较的一组实验处理的总和。水平:因素内的不同状态或者数量等级称为水平。试验因素:指试验中对实验指标有影响,在试验中需要加以考虑的各种条件,简称为因素或因子。通常用大写字母 A,B,C 等来表示。试验指标:衡量试验处理效果的指示性状称为试验指标或指标 试验效应:试验因素对试验指标所起的增加或减少作用称为试验效应。简单效应:单因素中,在同一因素内两种水平间试验指标的相差属简单效应,在多因素中,一个因素的水平相同,另一因素不同水平间的产量差异仍属简单效应 主要效应:一个因素内各简单效应的平均数称为平均效应,又叫主要效应。交互作用效应:两个因素简单效应间的平均差异 两个因素间的互作称为一级互作。三个因素间的互作称为二级互作。误差:在试验中实际观察值与其相应真值的偏差 误差来源:系统误差和偶然误差(也称随机误差)系统误差:由于在观测中因仪器不准,工作者的习惯和偏向等原因所引起的观测值的偏大或偏小的差异。随机误差:由于许多无法控制的内在、外在偶然因素所造成的偏差。准确性:是指观测值与其理论真值间的符合程度 精确性:观测值间的符合程度 田间试验的基本要求:1:试验目的要明确、2:实验条件要有代表性、3:实验结果要可靠 4:实验结果要能够重演 田间试验误差来源:实验材料固有的差异 试验时农事操作和管理技术的不一致所引起的差异 进行试验时外界条件的差异 控制田间试验误差的的途径:选择同质一致的实验材料、改进操作和管理技术,使之标准化、控制引起差异的的外界主要因素。田间试验三原则:重复、随机排列、局部控制。小区:在田间试验中,安排一个处理的小块地段称试验小区,简称小区。对照:保护行:对比法设计 间比法设计 完全随机设计:完全随机区组设计:拉丁方设计:裂区设计:再裂区设计:条区设计: