动物育种学课件-第-数量遗传学基础.ppt
动物育种学课件-第数量遗传学基础 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第一节第一节 数量性状的概念和特征数量性状的概念和特征数量性状的概念数量性状的概念生物的性状基本上可分为两两大类:质量性状质量性状(qualitative trait)变异可以截然区分为几种明显不同的类型,一般用语言来描述;数量性状数量性状(quantitative trait)个体间性状表现的差异只能用数量来区别,变异是连续的。阈性状阈性状(threshold trait):表现型呈非连续变异,与质量性状类似,但不是由单基因决定,性状具有一个潜在的连续型变量分布,遗传基础是多基因控制的,与数量性状类似。数量性状的特征数量性状的特征区分性状的依据区分性状的依据:性状是描述性的,还是可以度量的;性状是呈间断性分布,还是连续性分布;性状的表现是否容易受到环境的影响;控制性状的遗传基础是单基因还是多基因。数量性状的特征数量性状的特征数量性状在个体间的差异体现在量上或程度上,一般很难描述,需要度量;在一个群体中,数量性状变异呈连续性;数量性状受多基因控制;数量性状对环境影响敏感。第二节第二节 数量性状遗传的多基因假说数量性状遗传的多基因假说 微效多基因假说微效多基因假说(Nilsson-Ehle)主要论点如下:数量性状是由许多效应微小的基因控制;这些微效基因的效应相等且相加,故又称累 加基因,在世代相传中服从孟德尔原理,即分离规律和自由组合规律,以及连锁互换规律;这些基因间一般没有显隐性区别;数量性状同时受到基因型和环境的作用,而且数量性状的表现对环境影响相当敏感。假说的实质假说的实质数量性状由大量微效基因控制数量性状由大量微效基因控制 有限的基因如何控制众多的数量性状?有限的基因如何控制众多的数量性状?一般可以归结为下列三三个原因:基因仅仅是性状表现的遗传基础,它与性状的关系并非是“一一对应”的,基因作用往往是多效性的,而控制一个性状的基因数目也很多。因此,基因与性状的关系是“多因一效”和“一因多效”的;基因作用实际上除了加性效应外,等位基因间还存在有显性效应,非等位基因间还存在有上位效应。这些非加性互作效应的存在,使得基因型间的差异更加难以区分;数量性状的表现不仅仅取决于基因型,而且不同程度地受到环境效应的影响。数量性状基因座(数量性状基因座(QTL)对数量性状有较大影响的基因座称为数量性状基因座(数量性状基因座(quantitative trait locus,QTL),它是影响数量性状的一个染色体片段,而不一定是一个单基因座。确定单个确定单个QTL基因主要有几个方面的作用:基因主要有几个方面的作用:可以利用分子遗传标记对数量性状基因型进行标记辅助选标记辅助选择(择(marker-assisted selection,MAS)来提高家畜育种的效率,特别是对低遗传力性状和限性性状而言;将转基因技术用于数量性状的遗传操作;能够鉴别由多因素引起的遗传疾病,为基因治疗和改进预防措施提供依据;对这些QTL基因的数目和特性有所了解后,可以使数量遗传学理论建立在更加完善的基础上,对动物育种实践的指导更为科学合理。数量性状数学模型数量性状数学模型数量性状表型值剖分数量性状表型值剖分 数量性状表型值(P)线性剖分为基因型值(G)和环境效应值(E)两个部分,即:P=G+E+IGE (2.5)IGE是基因型与环境的互作偏差效应值 假设 ,则在同一固定环境条件下可认为 。影响数量性状表型值的环境效应,又可分为系统性环境效应系统性环境效应(或称固定环境效应固定环境效应)和随机环随机环境效应境效应两类。随机环境效应又可分为持久性环境持久性环境效应效应和暂时性环境效应暂时性环境效应。基因存在有三种不同的效应,即基因加性效应(additive effect)、等位基因间的显性效应(dominance effect)和非等位基因间的上位效应(epistatic effect)。可以将基因型值剖分为育种值(A)、显性效应偏差值(D)和上位效应偏差值(I)三个部分。D和I带有一定的随机性,一般均将它们归并到环境效应偏差值中,统称为剩余值,记为 R。P=G+E=A+D+I+E=A+R (2.6)假设假设Cov(A,R)=0 或 rAR=0 基因效应和育种值基因效应和育种值 考察一个具有等位基因A1和A2的基因座,假设纯合子A1A1的基因型值为+a,A2A2的基因型值为-a,杂合子A1A2的基因型值为d,它取决于基因的显性程度大小,无显性时d=0,完全显性时d=+a或-a,不完全显性时介于这两者之间,超显性时在这一范围之外,如图2.2所示。基 因 型 A2A2 A1A2 A1A1基因型值 -a 0 d +a 图图2.2 一对等位基因的基因型和基因型值示意图一对等位基因的基因型和基因型值示意图 如果是在一个随机交配的大群体中,A1和A2的频率分别为 p 和 q,那么群体的平均基因型值()和基因型值方差()为:若定义A1和A2基因的平均效应值分别为 和,则有:(2.8)(2.7)基因的平均效应基因的平均效应 是指该基因随机地与群体内的配子结合,所形成的全部基因型均值与全群均值的离差。基因替代的平均效应基因替代的平均效应 两种基因的平均效应值之差,反应了用一种基因取代另一种基因的群体均值变化,记为 ,即有:由此可以得到各种基因型的加性效应值,即育种值(育种值(breeding value)等于构成该基因型的两个等位基因的平均效应之和,分别为:第三节第三节 亲属间相关分析亲属间相关分析亲属相关,有两类概念:一是亲属间的遗传相关二是亲属间的表型相关。亲属间的遗传相关亲属间的遗传相关 是从整体而言的,用亲属个体的基因来自共同祖先的概率计算,描述亲属间整体上的亲缘相关程度,与具体的性状没有关系。亲属间的表型相关亲属间的表型相关 是描述亲属间性状表型值间的相关系数,由于只有特定的数量性状才有表型值,因此这种相关在不同性状、不同群体都是有所不同的。共同环境效应共同环境效应母体效应(母体效应(maternal effect)在妊娠、哺乳等阶段由母体的营养水平、饲养管理、个体间差异等对后代造成的影响。母体效应的影响分为两类两类:母体效应造成后代与母亲表现的相似性增加;母体效应造成同胞后代个体表现的相似性增加。亲属间遗传协方差亲属间遗传协方差 造成亲属间遗传相关的根本原因根本原因是它们有共同来源的祖先。同源一致性(同源一致性(identity by descent,IBD)(Malcot,1948):指亲属个体带有的基因是由某一共同祖先同一基因复制而来的。遗传协方差的实际构成比较复杂,在忽略上位效应和基因连锁时,它由一系列加性效应和显性效应以及各种互作效应构成,即:(2.10)X和Y是两个亲属个体,和分别是两个体的父系和母系基因同源的概率,下标A和D表示加性方差和显性方差。忽略各种显性效应和高阶加性协方差,可近似地认为,在随机交配(非近交)时有:(2.11)因此,如果忽略基因的上位效应和显性效应,可以得到亲属间因同源一致性造成的遗传相关,即亲缘系数(rA)为:(2.12)以同胞关系为例说明这一方法的应用。图2.3是全同胞关系示意图,其中S和D分别为父亲和母亲,括号中前面的小写字母表示父系基因,后面的表示母系基因。由于是非近交群体,所以,因此:S(e,f)D(g,h)X(a,b)Y(c,d)图图2.3 全同胞关系示意图全同胞关系示意图同样地:因此,可以得到:若X和Y为父系半同胞,则=0。因此,对于半同胞有:亲亲 属属 遗 传 协 方 差遗传相关同卵双生同卵双生11111全全 同同 胞胞半同胞(父系)半同胞(父系)00表兄妹(父系)表兄妹(父系)00双重表兄妹双重表兄妹亲子(父系)亲子(父系)100祖孙(父系)祖孙(父系)00叔侄(父系)叔侄(父系)00一般情况一般情况 表表2.2 亲属间遗传协方差和近似遗传相关亲属间遗传协方差和近似遗传相关第四节第四节 数量性状参数分析数量性状参数分析定量描述数量性状遗传规律有三三个最基本的遗传参数:重复力重复力、遗传力遗传力和遗传相关遗传相关重复力(重复力(repeatability)是衡量一个数量性状在同一个体多次度量值之间的相关程度的指标。对性状的终身表现产生的影响有:所有的基因效应所有的基因效应 持久性环境效应持久性环境效应 指时间上持久或空间上非局部效应的环境因素对个体性状表现所产生的影响。暂时性环境效应暂时性环境效应 一些暂时的或局部的特殊环境因素对个体性状的某次度量值产生影响重复力估重复力估计计原理原理从效应剖分看,可将环境效应()剖分为持久性环境效应()暂时性环境效应()两部分 ,因此假定基因型效应、永久性环境效应和暂时性环境效应之间都不存在相关,可以将表型方差()剖分为:故重复力 可定义为:重复力的作用重复力的作用重复力可用于验证遗传力估计的正确性重复力可用于确定性状需要度量的次数 假设一个个体度量了 次,用这些度量值的平均数作为该个体的平均表型值,记为 ,可以得到多次度量均值方差与单次度量值方差的关系为:当度量次数无穷大时,多次度量可以提高度量准确性的极限值为 ,因此以它为基础,多次度量可以提高的度量准确性效率()为:(2.14)(2.15)图图2.4 不同重复力不同重复力时时多次度量的相多次度量的相对对准确度(准确度(图图2.4 不同重复力时多次度量相对不同重复力时多次度量相对 准确度(准确度(Q)的变化曲线)的变化曲线 重复力可用于种畜育种值的估计重复力可用于种畜育种值的估计遗传力遗传力遗传力概念和估计原理遗传力概念和估计原理广义遗传力广义遗传力 指数量性状基因型方差占表型方差的比例,它反映了一个性状受遗传效应影响有多大,受环境效应影响多大。实现遗传力实现遗传力 指对数量性状进行选择时,通过亲代获得的选择效果,在子代能得到的选择反应大小所占的比值,这一概念反映了遗传力的实质。狭义遗传力狭义遗传力 指数量性状育种值方差占表型方差的比例。一般情况下所说的遗传力就是指狭义遗传力,用 表示。(2.16)根据通径分析原理,从图2.5可以看出,由于个体表型值完全决定于育种值和剩余值,在假定育种值和剩余值不相关的基础上可以得到:r是剩余值到表型值的通径系数 或(2.17)图图2.5 遗传力估计原理通径图遗传力估计原理通径图 R1 rR=0 A1 rA A2 rR=0 R2 P1 P2 r h h r 依据通径分析原理之一,即两个变量间的相关系数等于连接它们的所有通径链系数之和,而各通径链系数等于该通径链上的全部通径系数和相关系数之乘积。因此,假定不存在共同环境效应 ,和 的相关系数 等于 ,由此可得到遗传力为:式中,是两类个体育种值间的相关系数,即亲缘相关系数。(2.18)遗传力估计的基本方法遗传力估计的基本方法利用亲子资料估计遗传力利用亲子资料估计遗传力利用亲子资料估计遗传力一般有下列三种情况:l子女表型值对一个亲本的回归或相关估计 在随机交配情况下,亲子间的亲缘系数近似等于0.5,假设 表示单亲(任何一个亲本)表型值,表示子女表型值,可以得到利用简单回归或相关方法估计的遗传力为:(2.19)l 子女表型值对双亲均值的回归或相关估计 与子女表型值对单亲表型值的回归或相关估计类似,只是用双亲均值()来代替单亲表型值,可以得到利用简单回归或相关方法估计的遗传力为:(2.20)l 公畜内女母回归或相关估计 设有 头公畜,各配 头母畜,各有一个女儿,和 分别表示第 头公畜所配的第 头母畜表型值和其女儿表型值,表2.3列出了它们的平方和与乘积和,由此可以得到遗传力估计值如下,这里下标 表示公畜内的有关统计量:(2.21)利用同胞资料估计遗传力l 半同胞组内相关法 由表2.2可知,在近似条件下,半同胞间的亲缘系数为 ,将它代入(2.18)式可以得到:一般通过单因方差分析估计方差组分来计算,但应满足下列条件:所有变异来源除公畜个体效应外,其余的应全部为随机误差效应;(2.22)(2.23)公畜内个体间的遗传关系必须完全一致,即不应有全同胞个体存在,否则会使组内变异减小,遗传力估计偏高;公畜间应无亲缘相关,否则有亲缘相关的公畜组的半同胞间一致性增加,导致公畜间变异下降,遗传力估计偏低。如满足上述条件,假设有 头公畜,每一头公畜有 个半同胞子女,其中第 个子女的表型值为 ,利用单因素方差分析方法得到表2.4的结果,是有效平均子女数,因此遗传力估计值为:变异来源 母亲平方和 女儿平方和 母女乘积和 公畜间母畜间表表2.3 公畜内母、女平方和及乘积和公畜内母、女平方和及乘积和变异来源 自由度 平 方 和 均 方 期望均方公畜间母畜间表表2.4 半同胞遗传力估计方差分析表半同胞遗传力估计方差分析表l 全同胞组内相关法 由表2.2可知,在近似条件下,全同胞个体间的亲缘系数为 ,将它代入(2.18)式可以得到:(2.24)这里,表示全同胞个体间的表型相关。一般通过二因系统分组方差分析估计出各方差组分来计算。这样的分析应满足下列条件:所有变异来源除公畜个体效应和母畜个体效应外,其余效应全部为随机误差效应 公畜间的母畜不交叉;母体效应不存在或很小,可以忽略不计。否则,全同胞间会因母体效应导致组内变异变小,遗传力估计偏高;不同公畜、母畜间均无亲缘相关,否则存在亲缘相关的两组间的全同胞个体一致性增加,导致组间变异或下降,遗传力估计偏低。假设有 头公畜,各配 头母畜,每头母畜有 个全同胞子女,其中第 个子女的表型值为 ,利用二因系统分组方差分析方法得到如表2.5的结果,、和 是相应的有效重复数,因此遗传力估计值为:(2.25)变异来源变异来源 自由度自由度 平平 方方 和和 均均 方方 期望均方期望均方公畜间公畜间公畜内公畜内母畜间母畜间公母畜内公母畜内子女间子女间表表2.5 全同胞遗传力估计方差分析表全同胞遗传力估计方差分析表显著性检验显著性检验l 用亲子资料估计遗传力时,显著性检验与普通的回归分析和相关分析一样;l 用半同胞资料估计时,遗传力的显著性检验可转化为组内相关系数的显著性检验。即:(2.26)l 用全同胞资料估计时,可用方差分析的检验近似替代,或用组内相关系数的显著性检验替代。为使估计的遗传力达到统计显著,一般都需要增加样本含量。在总样本含量一定的情况下,可以确定出近似的最宜家系数和家系大小。以半同胞资料估计遗传力为例,最宜家系大小为 ,由(2.25)式可以推算出不同遗传力大小时,检验达到显著所需的最低样本含量,如表2.6。表表2.6 半同胞资料遗传力估计显著所需最低样本含量半同胞资料遗传力估计显著所需最低样本含量遗传力遗传力遗传力遗传力近似家系数近似家系数近似家系数近似家系数近似家系含量近似家系含量近似家系含量近似家系含量近似总样本含量近似总样本含量近似总样本含量近似总样本含量 0.05 0.05 31 31 80 80 2478 2478 0.10 0.10 30 30 40 40 1209 1209 0.15 0.15 30 30 27 27 786 786 0.20 0.20 29 29 20 20 575 575 0.25 0.25 28 28 16 16 449 449 0.30 0.30 27 27 13 13 364 364 0.35 0.35 27 27 11 11 305 305 0.40 0.40 26 26 10 10 260 260 0.45 0.45 25 25 9 9 225 225 0.50 0.50 25 25 8 8 197 197 0.60 0.60 23 23 7 7 156 156 0.70 0.70 22 22 6 6 126 126 0.80 0.80 21 21 5 5 105 105 0.90 0.90 20 20 4 4 88 88举例举例【例2.2】统计某纯种地方猪种 3头种公猪的仔猪肥育期平均日增重列于表2.7。用全同胞组内相关估计遗传力。整理资料整理资料 按种公猪所配母猪分组,将仔猪日增重记录列成表2.7。计算平方和、自由度及列方差分析表计算平方和、自由度及列方差分析表 如表2.8所示。计算遗传力计算遗传力公猪公猪母猪母猪全同胞子女日增重全同胞子女日增重S1D11403 392 382 395415726180224411D12404 3952799319241D13397 406 425 418 39452040833030S2D21395 412 407312144914186735D22384 3952779303481D23410 382 394 39041576621360D24405 396 38731188470610D25382 395 406 392 40351978782858S3D31405 415 396 418 407520418334396077D32423 397 409 41141604672740D33405 418 39231215492413D34385 402 39431181465065总和总和1243172236903677表表2.7 仔猪肥育期平均日增重(仔猪肥育期平均日增重(g)变异来源变异来源自由度自由度平方和平方和均方均方期望均方期望均方公猪间公猪间2642.4940321.2470公猪内公猪内母猪间母猪间91367.8700151.9856公母猪内公母猪内子女间子女间313254.3340104.9785表表2.8 平均日增重的全同胞资料遗传力估计方差分析表平均日增重的全同胞资料遗传力估计方差分析表由此得到三个遗传力估计值分别为:影响遗传力估计的因素影响遗传力估计的因素 遗传力是性状、群体和环境三者特性的综合体现。因此,群体遗传结构和环境条件的改变,都会影响到性状遗传力本身。当遗传与环境存在互作效应时,的假设不能成立,由此会导致遗传力估计出现大的偏差。共同环境造成亲属间的环境相关,即 的假定不能成立,因此前述的遗传力各种估计方法均不能应用。造成亲属间环境相关最主要的是母体效应。不同性状的母体效应影响是不同的,如果它的影响很大,则不宜采用全同胞相关和女母相关等估计遗传力。在前述各种遗传力估计方法中,实际上都假定了亲本个体间不存在亲缘相关。例如,女母相关或回归时的母畜间,公畜内女母相关或回归及同胞分析时的公畜间、母畜间和公母畜间,均不应存在有亲缘相关。但是这一假定在实际动物育种中是难以成立的。选择对遗传力的影响。从理论上讲选择将导致遗传基础一致性增强,即 下降,也下降。所以用于估计遗传力的资料应是由群体抽取的一个随机样本。然而,实际的估计资料,如全同胞和半同胞资料,它们的父母亲一般均是经过选留的。配种方式对遗传力的影响。一般对于杂交而言,由于杂交亲本难以达到较强的遗传基础一致性,因而不宜采用这种资料估计遗传力。从效应上讲,近交个体对环境敏感,增大;而且近交导致群体分化,加大了群体变异,所以 也增加,相应地降低。不同的遗传力估计方法,其应用条件和估计准确度都有所不同。样本含量对遗传力估计有很大的影响。一般而言,参数的构成愈复杂,其估计愈难达到统计显著,需要的样本含量也愈大。遗传相关遗传相关遗传相关概念和估计原理遗传相关概念和估计原理表型相关(表型相关(phenotypic correlation)就是同一就是同一个体的两个数量性状度量值间的相关。个体的两个数量性状度量值间的相关。一般而言一般而言,造成这一相关的原因区分为造成这一相关的原因区分为两两大类:大类:一类是由于基因的一因多效和基因间的连锁不平衡一类是由于基因的一因多效和基因间的连锁不平衡造成的性状间遗传上的相关。造成的性状间遗传上的相关。另一类是由于两个性状受个体所处相同环境造成的另一类是由于两个性状受个体所处相同环境造成的相关,称之为相关,称之为环境相关(环境相关(environmental correlation)。在这两类遗传和环境相关原因的共同作用下,在这两类遗传和环境相关原因的共同作用下,两个性状之间就呈现出一定的表型相关,用图两个性状之间就呈现出一定的表型相关,用图2.6表示。表示。图图2.6 不同性状表型相关的剖分不同性状表型相关的剖分 PX、PY、AX、AY和RX、RY分别表示性状和性状的表型值、育种值和剩余值;hX、hY和eX、eY分别表示两性状育种值到表型值的通径系数和剩余值到表型值的通径系数;re(XY)和 r(XY)分别表示两性状的环境相关和遗传相关。假定各种育种值与剩余值间均不相关,那么根据通径分析原理可以将表型相关剖分为两部分,得到:(2.27)遗传相关估计方法遗传相关估计方法利用亲子资料遗传相关估计利用亲子资料遗传相关估计 设PX、PY和OX、OY分别表示亲代和子代X、Y两性状的表型值,假定亲子间的同一性状无环境相关,那么这两个性状间的遗传相关可以用下面两个公式计算:(2.28)(2.29)利用同胞资料遗传相关估计利用同胞资料遗传相关估计 半同胞资料估计遗传相关的计算公式:举例举例【例2.3】对某羊场的部分育成母羊的毛长(X)和剪毛量(Y)资料进行统计分析,得到表2.9的方差、协方差分析结果,并计算出 。采用公畜内半同胞遗传相关估计两性状的遗传力和遗传相关。经过整理资料整理资料,计算平方和、乘积和及自由度等步骤,已得到相应的方差和协方差分析结果,如表2.9。计算各方差和协方差组分计算各方差和协方差组分:毛 长:,剪毛量:,变异变异来源来源自自由由度度毛长(毛长(X X)剪毛量(剪毛量(Y Y)毛长毛长(X)(X)剪毛量剪毛量(Y Y)平方和平方和均方均方平方和平方和均方均方乘积和乘积和均积均积公羊间公羊间2 29.20089.20084.60044.60046.80536.80533.40273.40272.53222.53221.26611.2661公羊内公羊内525269.526569.52651.33701.337038.188538.18850.73440.734421.931421.93140.42180.4218表表2.9 育成母羊的毛长和剪毛量方差、协方差分析表育成母羊的毛长和剪毛量方差、协方差分析表毛长剪毛量:计算两性状的遗传力:计算两性状的遗传力:计算两性状的表型相关、遗传相关和环境相关计算两性状的表型相关、遗传相关和环境相关:遗传相关的主要作用遗传相关的主要作用间接选择(间接选择(indirect selection)指当对一个性状(如X)不能直接选择,或者直接选择效果很差时,借助与之相关的另一个性状(如Y)的选择,来达到对选择的目的,Y 性状就称之为辅助性状(assistant trait)。不同环境下的选择不同环境下的选择 用于比较不同环境条件下的选择效果。多性状选择多性状选择 遗传相关在选择指数理论中具有重要的作用,这是遗传相关最主要的用途。