《基因和基因组》课件.ppt
第一章第一章 基因组概论基因组概论细胞内的遗传物质细胞内的遗传物质 1.1.染色体(染色体(chromosomechromosome)和染色质(和染色质(chromatinchromatin):):细胞内的一种形态结构,细胞内的一种形态结构,易被碱性染料染成深色,易被碱性染料染成深色,由核酸和蛋白质组成。由核酸和蛋白质组成。2.2.基因组(基因组(genomegenome):):细细胞胞中中一一套套完完整整单单体体遗传物质的总和遗传物质的总和。3.3.基因(基因(genegene)基因组的功能单位。基因组的功能单位。基因基因(genegene)的分子生物学定义的分子生物学定义 合成有功能的合成有功能的蛋白质或蛋白质或RNARNA所必需的全部所必需的全部DNADNA序序列(除部分病毒列(除部分病毒RNARNA),即一个基因不仅包括编码),即一个基因不仅包括编码蛋白质或蛋白质或RNARNA的核酸序列(的核酸序列(编码序列编码序列),还应包括),还应包括为保证转录所必需的调控序列为保证转录所必需的调控序列(非编码序列非编码序列)。&本质:本质:DNADNA或或RNARNA&产物:产物:蛋白质或蛋白质或RNARNA 转录单位(转录单位(transcription unittranscription unit)蛋白基因鉴别标准1 1 开放阅读框架开放阅读框架(open reading frame,ORF)始于起始密码子并终于终止密码子的一串密始于起始密码子并终于终止密码子的一串密码子组成的核苷酸序列码子组成的核苷酸序列2 2 密码子偏爱密码子偏爱3 3 序列保守性序列保守性4 4 转录产物转录产物5 5 基因失活基因失活 总结:总结:1、DNA与染色体的关系:与染色体的关系:2、DNA分子的特点:分子的特点:3、DNA与基因的关系:与基因的关系:4、DNA是是DNA是组成染色体的主要物质是组成染色体的主要物质相对分子质量很大,相对分子质量很大,分子由两条长链组成,盘成螺旋状分子由两条长链组成,盘成螺旋状(双螺旋双螺旋)基因是基因是DNA分子上起遗传作用的一些片段分子上起遗传作用的一些片段 (相当于火车与车厢的关系)(相当于火车与车厢的关系)一种遗传物质,但不是唯一的一种一种遗传物质,但不是唯一的一种。染色体染色体 DNA 基因基因 基因组基因组(genome)()(P10)是指生物体全套是指生物体全套单倍体遗传信息,包单倍体遗传信息,包括所有基因和基因间括所有基因和基因间的区域的区域。对人类而言:对人类而言:22+X+Y+mtDNA22+X+Y+mtDNA46,XY 细胞中一套完整单体遗传物质的总和细胞中一套完整单体遗传物质的总和。基因总数基因总数 基因组中基因数目与生物进化程度和复杂程度的基因组中基因数目与生物进化程度和复杂程度的不对称性不对称性N值矛盾(值矛盾(N value paradox)基因大小基因大小 基因组中基因大小(基因组中基因大小(bp)与生物进化程度和复杂)与生物进化程度和复杂程度的不对称性程度的不对称性C值矛盾(值矛盾(C value paradox)基因组计划基因组计划 以获得某物种基因组全序列为主要目标的以获得某物种基因组全序列为主要目标的科学计划科学计划基因组计划基因组计划基本原理:人类基因组基本原理:人类基因组DNADNA 打碎打碎 拼接拼接基因组测序计划 海量DNA序列数据DNADNA序列是生命的真谛,这个世界上发生的一切事情序列是生命的真谛,这个世界上发生的一切事情都与这一序列息息相关。都与这一序列息息相关。人类基因组计划(人类基因组计划(人类基因组计划(人类基因组计划(HGPHGP)1990年启动目标:测定人类基因组的全部DNA序 列,了解基因及其功能国际大合作:国际大合作:美国、英国、日国、美国、英国、日国、法国、德国、中国法国、德国、中国投入:30亿美元结果:2003年完成精细图,产生约32亿个数据(碱基)人类基因组计划人类基因组计划(human genome project,HGP)遗传图谱遗传图谱(genetic map)(连锁图(连锁图 linkage map)用遗传标签确定基因排列顺序 物理图谱(物理图谱(physical map):确定排列距离 序列图谱序列图谱(sequence map):碱基排列顺序10/26/2022复旦大学图书馆文献检索教研室检索字段限制分子类型选择基因位置限定序列片段限定数据更新,日期限定功能栏核酸序列检索10/26/2022复旦大学图书馆文献检索教研室序列存取号基因定义数据库标识符10/26/2022复旦大学图书馆文献检索教研室代码物种来源参考文献特性10/26/2022复旦大学图书馆文献检索教研室原序列复制后,可到BLAST中进行相似性 对本AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATAA C G T相当于相当于相当于相当于32003200本每本本每本本每本本每本10001000页每页页每页页每页页每页10001000字的字的字的字的“天书天书天书天书”基因组学(genomics)对所有基因进行基因组作图,核苷酸序列分对所有基因进行基因组作图,核苷酸序列分析,基因定位和基因功能分析的一门科学。析,基因定位和基因功能分析的一门科学。结构基因组学结构基因组学(structural genomics)以全基因组测序为目标以全基因组测序为目标功能基因组学功能基因组学(functional genomics)以基因功能鉴定为目标以基因功能鉴定为目标功能基因组学功能基因组学后基因组计划后基因组计划1.1.功能基因组学功能基因组学2.2.蛋白质组学蛋白质组学3.3.比较基因组学比较基因组学4.4.环境基因组学环境基因组学5.5.药物基因组学药物基因组学6.6.基因组多态性的研究基因组多态性的研究7.模式生物体基因组研究模式生物体基因组研究掌握下列概念基因基因结构基因结构基因基因组基因组基因组学基因组学开放阅读框架开放阅读框架HGP第二章第二章 原核生物基因组特征原核生物基因组特征 原核生物原核生物(prokaryote)是细)是细菌、支原体、衣原体、菌、支原体、衣原体、立克次体、螺旋体、立克次体、螺旋体、放线菌和蓝绿藻等原放线菌和蓝绿藻等原始生物的总称,是最始生物的总称,是最简单的细胞生物体。简单的细胞生物体。原核生物基因组特点原核生物基因组特点 基因组基因组较小较小,通常由一条,通常由一条环状双链环状双链DNADNA(double double stranded DNAstranded DNA,dsDNAdsDNA)分子组成。)分子组成。大肠杆菌基因组大肠杆菌基因组DNA分子量为分子量为2.64109 Da,由,由4.2106 bp组成,是人类基因组的组成,是人类基因组的1,且基因数目也较少,大约含且基因数目也较少,大约含3500个基因。个基因。类类核核结结构构 操纵子结构是原核生物基因组的功能单位操纵子结构是原核生物基因组的功能单位 多顺反子多顺反子mRNAmRNA(polycistronic mRNApolycistronic mRNA)在共同的启动子作用下,转录出的一个在共同的启动子作用下,转录出的一个mRNAmRNA分子带有几种蛋白分子带有几种蛋白质的遗传信息,可编码几种不同的,但多为功能相关的蛋白质。质的遗传信息,可编码几种不同的,但多为功能相关的蛋白质。结构基因通常以单拷贝形式存在结构基因通常以单拷贝形式存在 rRNArRNA及及tRNAtRNA基因多拷贝基因多拷贝 基因连续,基因内没有基因连续,基因内没有内含子内含子(古细菌除外)(古细菌除外)非编码的非编码的DNADNA序列序列所占比例较真核生物少得所占比例较真核生物少得 多,通常包含调控基因表达的序列。多,通常包含调控基因表达的序列。重复序列重复序列很少很少 具有具有可移动序列可移动序列 1.1.什么是质粒什么是质粒2.2.质粒命名的原则质粒命名的原则3.3.质粒的分类质粒的分类4.4.质粒的结构质粒的结构质粒质粒(plasmid)5.5.质粒的生物学特征质粒的生物学特征二、质粒二、质粒 1.1.什么是质粒什么是质粒(plasmid)?(plasmid)?细菌细胞染色体以外,能独立复制并稳定遗细菌细胞染色体以外,能独立复制并稳定遗传的共价闭合环状传的共价闭合环状DNADNA分子。分子。染色体染色体DNA质粒质粒DNA二、质粒二、质粒质粒的结构质粒的结构 三种构型三种构型:共价闭环共价闭环DNADNA分子分子 半开环半开环DNADNA分子分子 线性线性DNADNA分子分子二、质粒二、质粒质粒的理化性质质粒的理化性质具有核酸分子的一般理化特性:具有核酸分子的一般理化特性:可嵌入某些染料(溴化乙锭可嵌入某些染料(溴化乙锭,EB,EB)(Syber Green)(Syber Green)具有较强的抗切割和抗变性的能力具有较强的抗切割和抗变性的能力二、质粒二、质粒二、质粒二、质粒 2.2.质粒命名的原则质粒命名的原则 用小写字母用小写字母p p代表质粒,在代表质粒,在p p字母后面用两个字母后面用两个大写字母代表发现这一质粒的作者或实验室名称。大写字母代表发现这一质粒的作者或实验室名称。pUC118pUC118plasmid编号发现者名字质粒的特征质粒的特征(p79)1.结构为结构为环状超螺旋环状超螺旋DNADNA分子分子2.2.自主复制性自主复制性3.3.不相容性不相容性4.4.可扩增性可扩增性5.5.可转移性可转移性6.6.带有选择性标记带有选择性标记二、质粒二、质粒质粒的不相容性质粒的不相容性 同一类群同一类群的不同质粒通常不能在同一菌株内稳的不同质粒通常不能在同一菌株内稳定共存,当细胞分裂时就会分别进入不同的子代细定共存,当细胞分裂时就会分别进入不同的子代细胞,这种现象叫做质粒的不相容性。胞,这种现象叫做质粒的不相容性。不同群不同群的质粒(如的质粒(如F F和和ColEColE)可以在同一菌株)可以在同一菌株内稳定共存,这些质粒具有相容性。内稳定共存,这些质粒具有相容性。二、质粒二、质粒3 3、质粒的分类、质粒的分类复制机制复制机制 严紧型严紧型 松弛型松弛型 功能功能 F F质粒(性质粒)质粒(性质粒)R R质粒(耐药性质粒)质粒(耐药性质粒)Col Col质粒(大肠埃希菌质粒)质粒(大肠埃希菌质粒)转移方式转移方式 接合型接合型 可移动型可移动型 自传递型自传递型 大小大小 小型小型15kb)15kb)大型大型(60kb(60kb120kb)120kb)宿主范围宿主范围 窄宿主谱型窄宿主谱型 广宿主谱型广宿主谱型 质粒的转移质粒的转移 分子量在分子量在2.5102.5107 7DaDa以上的质粒可以从供体细胞将以上的质粒可以从供体细胞将 一个复本转移给受体细胞,如一个复本转移给受体细胞,如F F质粒和质粒和R R质粒。质粒。分子量在分子量在1101107 7DaDa以下的质粒一般无自我转移能力。以下的质粒一般无自我转移能力。二、质粒二、质粒转化转化-将将质粒质粒或以质粒为载体的重组或以质粒为载体的重组DNADNA分子导入细菌,使其在分子导入细菌,使其在细细菌体内菌体内扩增及表达的过程称为扩增及表达的过程称为转化转化(transformation(transformation)重组质粒重组质粒细细 菌菌(CaCl2处理)处理)细细 菌菌(CaCl2处理)处理)质粒导入未成功质粒导入未成功质粒导入成功质粒导入成功质粒导入不成功质粒导入不成功感受态细胞感受态细胞(competent cell)细胞膜结构改变、通透性增加并具有细胞膜结构改变、通透性增加并具有摄取外源摄取外源DNA能力的细胞称谓感受态能力的细胞称谓感受态细胞细胞(competent cell)。常用低渗的常用低渗的(0.1%)CaCl2洗涤受体细胞洗涤受体细胞制作成感受态细胞。制作成感受态细胞。当细菌处于当细菌处于00、二价阳离子低渗溶液中时,细、二价阳离子低渗溶液中时,细 菌细胞膨胀成球形,处于感受态菌细胞膨胀成球形,处于感受态 转化混合物中的转化混合物中的DNADNA形成抗形成抗DNADNA酶的羟基酶的羟基-钙磷酸钙磷酸 复合物粘附于细胞表面,复合物粘附于细胞表面,在在4242短时间热冲击短时间热冲击 后后DNADNA进入细胞。进入细胞。转化效率为每微克转化效率为每微克DNADNA可获得可获得10105 510106 6转化子转化子CaClCaCl2 2法法转化的方法可分为转化的方法可分为CaCl2法和电穿孔法法和电穿孔法二、质粒二、质粒质粒的选择性标记质粒的选择性标记 抗药性基因、酶基因标记等。抗药性基因、酶基因标记等。最常见的选择性标记是抗药性基因,即带有一种最常见的选择性标记是抗药性基因,即带有一种 或多种抗生素的抗性基因,可赋予宿主菌抵抗某种抗或多种抗生素的抗性基因,可赋予宿主菌抵抗某种抗 生素的能力。生素的能力。抗生素抗性标记筛选抗生素抗性标记筛选 因大多数质粒载因大多数质粒载体带有抗生素抗性标记的特征(如体带有抗生素抗性标记的特征(如Ampr、Tetr等),当带有完整抗性基因的载等),当带有完整抗性基因的载体转化无抗性细菌后,被转化的体转化无抗性细菌后,被转化的阳性菌阳性菌获得抗生素抗性基因而存活获得抗生素抗性基因而存活,未转化菌不未转化菌不能存活。能存活。复制起复制起始点始点抗药基因抗药基因抗药基因抗药基因酶基因标记 载体中装入一个来自载体中装入一个来自大肠杆菌乳糖大肠杆菌乳糖操纵子的操纵子的DNADNA片段片段(lacZlacZ 基因)基因),该基因编码,该基因编码-半乳糖苷酶氨基端的一个片段,半乳糖苷酶氨基端的一个片段,异丙基异丙基-D-D-硫代半乳糖苷(硫代半乳糖苷(IPTGIPTG)可诱导此片段合成,而此)可诱导此片段合成,而此片段能与宿主细胞所编码的缺陷型片段能与宿主细胞所编码的缺陷型-半乳糖苷酶实现半乳糖苷酶实现基因内互基因内互补(补(-互补)互补),形成完整的,形成完整的-半乳糖苷酶。半乳糖苷酶。-半乳糖苷酶能半乳糖苷酶能催化指示剂底物催化指示剂底物5-5-溴溴-4-4-氯氯-3-3-吲哚吲哚-D-D-半乳糖苷(半乳糖苷(X-gal X-gal)形成蓝色菌落。如形成蓝色菌落。如lacZlacZ 基因中含有基因中含有MCSMCS,当外源基因插入,当外源基因插入MCSMCS,lac lac -肽基因阅读框架被破坏,细菌内将无肽基因阅读框架被破坏,细菌内将无-半乳糖苷酶活半乳糖苷酶活性,菌落呈白色。性,菌落呈白色。半乳糖苷酶的半乳糖苷酶的蓝白斑筛选蓝白斑筛选实验实验:阳性克隆阴性克隆-半乳糖苷酶基因失活筛选半乳糖苷酶基因失活筛选 蓝白斑筛选蓝白斑筛选