医学分子生物学-整理笔记(29页).doc
《医学分子生物学-整理笔记(29页).doc》由会员分享,可在线阅读,更多相关《医学分子生物学-整理笔记(29页).doc(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-医学分子生物学-整理笔记-第 28 页第2章 基因、基因组和基因组学基因 (gene):携带有遗传信息的 DNA或 RNA序列,也称为遗传因子。基因是合成有功能的蛋白质或 RNA所必需的全部 DNA,包括编码蛋白质或 RNA的核酸序列,也包括为保证转录所必需的调控序列。基因的功能:传递遗传信息,控制个体性状表现。 结构基因 (structural genes):可被转录形成 mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。调节基因 (regulatory genes) :某些可调节控制结构基因表达的基因。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质
2、(或酶)量的改变。 eg. miRNA, siRNA, piRNA种类IIIIII分布核仁核基质核基质产物rRNAmRNA, microRNA5S rRNA, tRNA, siRNA 核糖体 RNA 基因 (ribosomal RNA genes) 与转运 RNA 基因 (transfer RNA genes):只转录产生相应的RNA而不翻译成多肽链。 真核生物的RNA聚合酶 ( 3种):RNA 聚合酶 I, II, III. 开放阅读框架 (open reading frame,ORF):在DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码序列。断裂基(split gene
3、):真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质。基因组 (genome):一个细胞内的全部遗传信息,包括染色体基因组和染色体外基因组。 基因组中的 DNA包括编码序列和非编码序列。 部分病毒基因组-RNA。 C值 (C-value):一种生物体单倍体基因组DNA的总量,用以衡量基因组的大小。通常,进化程度越高的生物其基因组越大,但从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关。存在 C-value paradox (C值悖理)。生物复杂性越高,其基因的密度越低。 病毒基因组的大小: 与细菌或真核
4、细胞相比,病毒的基因组很小。不同的病毒之间基因组大小相差很大。乙肝病毒DNA:3kb,编码4种蛋白质;痘病毒的基因组:300kb,编码几百种蛋白质。病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。 RNA 病毒基因组编码序列具有节段性 :有些病毒的基因组 RNA由不连续的几条核酸链组成(如流感病毒,轮状病毒等)。 分段基因组的病毒一般感染效率较低 ;分段基因组容易发生重组,故病毒容易变异 。 目前未发现DNA病毒有此状况。病毒基因存在基因重叠 :基因重叠:同一段DNA片段能够参与编码两种甚至两种以上的蛋白质分子。这种现象在其它的生物细胞中仅见于线粒体和质粒DNA。此结构意
5、义在于使较小的基因组能够携带较多的遗传信息。 基因重叠的方式 :1)一个基因完全在另一个基因里面。2)几个基因部分重叠。3)两个基因之间只有一个碱基重叠。 重叠基因的DNA序列可能大部分相同,但由于翻译时的读码框架不同、或起始部位不同而产生不同的蛋白质。 有些真核病毒的部分序列,对某一个基因来说是内含子,而对另一个基因而言却是外显子。 病毒基因组的大部分序列具有编码功能:病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码翻译功能。 X174基因组中不编码的序列只占217/5375。乳头瘤病毒基因组约,其中不编码的部分约为。 少数真核生物病毒的基因组也存在内含子结构。病毒基因组的转
6、录单元是多顺反子 :多顺反子 mRNA (polycistronie mRNA) :病毒基因组DNA序列中功能上相关的蛋白质的基因或 rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个 mRNA 的分子。病毒基因组都是单倍体:除了逆转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。 逆转录病毒带有逆转录酶,能使RNA反向转录生成DNA,因此其基因组可拥有两个拷贝。 噬菌体基因具有连续性:噬菌体的基因是连续的,而真核细胞病毒的基因是不连续的,具有内含子。 原核生物基因组通常比较简单,其基因组大小在106bp107bp
7、之间,所包含的基因数目几百个到数千个之间。 原核生物基因组通常由一条环状的双链DNA分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域,称为类核(nucleoid). 大肠杆菌染色体基因组的结构和功能 :大肠杆菌基因组序列中的基因密度非常高,编码区所占的比例较大。大肠杆菌中总共有4288个基因,平均编码长度为 950bp,基因之间的间隔区长度为 118bp,而且这些结构基因没有内含子。大肠杆菌DNA分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为 转座子 的50kb的重复片段。 转座因子:原核生物转座因子主要有二类:插入序列 (insertion sequen
8、ce,IS) : IS:2000bp以内,两端都有正向重复序列(direct repeats,DR)和反向重复序列(inverted repeats,IR),中间1kb左右的编码序列,仅编码和转座有关的转座酶。 只有当 IS 转座到某一基因中使该基因失活或插入位点旁边的染色体发生畸变等效应时才会被发现。 复合型转座子 ( composite transposon, Tn) : Tn :200020000bp之间,两端由一对 IS 元件组成,带有与转座作用有关的基因以及其他基因。 根据转座的的机制和结果,可将转座分为:复制型转座,保守型转座大肠杆菌染色体外基因组的结构和功能:质粒(plasmid
9、):一类染色体外具有自主复制能力的环状双链DNA分子,属染色体外基因组。 大肠杆菌质粒是双链环状结构的 DNA 分子。可以有共价闭合环状 DNA(covalently closed circular DNA,cccDNA)、缺口的环状 DNA、线性DNA 三种结构状态。质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些遗传性状。质粒能自主复制,是能独立复制的复制子(autonomous replicon)。严紧控制(stringent control)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。松弛控制(r
10、elaxed control)型质粒:其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。 质粒的稳定性与不相容性: 质粒的不相容性(incompatibility):两种不同质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失。 携带不同复制和维持机制的质粒属于不同的不相容群,它们可以共存于同一细胞中。 影响质粒稳定性的因素:1.主细胞分裂时质粒能否均衡地分配到子代细胞。2.质粒分子自身结构的稳定性。 真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中-细胞核基因组和细胞器基因组。 真核生物染
11、色体基因组特点 : 人类基因组中仅含有2500030000个基因,远低于预期。在人类基因组中只有很少一部份(约2-3)DNA序列用以编码蛋白质和结构RNA。人类基因组中存在大量基因间隔区序列,主要由重复DNA构成。 在基因内部含大量内含子。 单拷贝序列:占 40%-80%,结构基因基本上属于单拷贝序列。中度重复序列:重复次数10105,占 10-40%。如rRNA、tRNA、组蛋白以及免疫球蛋白的基因等,另有部分可能与基因的调控有关。高度重复序列:拷贝数大于106 ,占 10-60%。如反向重复序列 (inverted repeats) 和卫星DNA (satellite DNA)。 反向重复
12、序列常见于基因的调控区,可能与复制、转录的调控有关。 重复序列的多态性:DNA多态性:DNA 序列发生变异从而导致的个体间核苷酸序列的差异。主要包括 单核苷酸多态性(single nucleotide polymorphism,SNP)和 串联重复序列多态性(tandem repeats polymorphism)。 SNP-由基因组DNA上的单个碱基的变异引起的DNA序列多态性。 据估计,人类基因组中每1kp就存在一个SNP位点,共有约300万个之多,是人群中个体差异最具代表性的DNA多态性。 相当一部分SNP还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。 大
13、多数SNP位点十分稳定,人类85%的SNP是共有的。 高度重复序列中的无间隔反向重复序列很容易形成限制性内切酶识别位点,也很容易因为突变产生或是失去一个酶切位点,可以造成 限制性片段长度多态性 (restriction fragment length polymorphism, RFLP).真核基因组存在多基因家族与假基因 :多基因家族 (multi gene family):由某一祖先基因经过重复和变异所产生的一组基因。 假基因 (pseudo gene):与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。 多基因家族大致可分为两类: 一个基因家族的不同成员成簇地分布在不同染
14、色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。 基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内,这种分布方式与DNA复制时需要大量的组蛋白有关。 假基因的产生有两种方式:由突变引起的基因序列变化而失去功能,这样产生的假基因带有内含子,称为常规假基因(conventional pseudogene)。mRNA经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,称为已加工的假基因(processed pseudo
15、genes)。真核生物细胞器基因组:真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。 线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如ATP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。其它成员由细胞核基因组编码。 高等动物线粒体基因组具有独特的特点:母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。 线粒体DNA损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。遗传密码与通用遗传密码存在差别,如UGA(终止密码子)编
16、码Trp,AGA/AGG(Arg)为终止密码子等。 基因组学(Genomics):对生命有机体全基因组进行序列分析和功能研究的学科。 结构基因组学:目的是在生物体的整体水平上测定出全部蛋白质分子、蛋白质蛋白质、蛋白质与其他生物分子复合体的三维结构。 基因定位克隆:利用微卫星和SNP全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进一步获得克隆。 功能基因组学:根据已有基因的功能推测基因组中具有相似结构的基因的功能,通过实验手段验证。有效的方法有定点突变、基因敲除(knock-out)和RNA干扰及过量表达技术等。 第3章 蛋白质组学蛋白质是一种复杂的有机生物大分子,它们
17、是生命活动的实际执行者。几乎所有的生物催化剂-酶,都是蛋白质。构成细胞骨架和动物大部分结构的纤维物质也是蛋白质;胶原蛋白和角蛋白组成了皮肤,毛发和软骨;肌肉大部分也是由蛋白质组成。蛋白质由一个一个的氨基酸首尾相接形成肽链,肽链再折叠形成一定空间结构。蛋白质组(proteome):指由一个基因组,或一个细胞、组织表达的所有蛋白质。蛋白质组学(proteomics):以蛋白质组为研究对象,分析细胞内动态变化的蛋白质组成成分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,在整体水平上研究蛋白质的组成与调控的活动规律。 功能蛋白质组:细胞在某一阶段或与某一生理现象相关的所有蛋白质。差异蛋白质组:
18、不同种类或状态下各种样本之间蛋白质组的区别与变化。多样-蛋白质数目大大超过基因数目。可变-蛋白质随时间与空间变化。基于凝胶的工作流程是目前使用的较为广泛的、发展最为成熟的工作流程。样品制备:样品来源:细胞、组织、体液等。可采用全蛋白;或进行预分级(线粒体、高尔基体、叶绿体、膜蛋白、核蛋白等)-提高低丰度蛋白质的上样量及检测灵敏度。尽可能扩大蛋白质的溶解度和解聚,以提高分辨率。样品分离:双向凝胶电泳(two-dimensional electrophoresis,2-DE):利用蛋白质的等电点与分子量差异分离之。2-DE 的缺点:难以有效分离极酸、极碱性蛋白质,极大、极小蛋白质,及低丰度蛋白质。
19、胶内酶解过程费时、费力,难以与质谱实现自动化联用。第一向:等电聚焦 IEF;第二向:SDS-PAGE。染色方法:考马斯亮蓝染色;银染(不含戊二醛);荧光染色(Cy3,Cy5),放射性同位素标记等。新型非凝胶技术:液相色谱法(liquid chromatography, LC)对在双向电泳中难以分离鉴定的高分子量、低分子量、极酸性、极碱性和疏水性强的蛋白进行有效的分离鉴定。LC-MS/MS:液质联用技术。微量测序(microsequencing):N-末端Edman降解:经凝胶分离的蛋白质直接印迹在PVDF膜或玻璃纤维膜上N末端氨基酸残基经苯异硫氰酸酯修饰从多肽链上切下修饰的残基再经层析鉴定余下
20、的多肽链被回收再进行下一轮降解循环。 缺点:过程缓慢,消耗大,试剂昂贵。质谱分析(Mass spectrometry):基本原理:样品分子离子化后,根据离子间质荷比(m/z)差异来分离并确定样品分子量。主要质谱类型:MALDI-TOF MS: 基质辅助激光解吸/电离飞行时间质谱 (Matrix-assisted laser desorption/ionization time of flight mass spectrometry)利用固体基质分子均匀包埋样品分子,在激光照射下,基质分子吸收激光能量而蒸发,携带样品分子进入气相,进一步将能量传递给样品分子,从而实现样品分子离子化。MALDI 最
21、大的特点是离子电荷通常为1-2个,而不象ESI中为多电荷离子,对分子质量较大的样品而言,不会形成复杂的多电荷图谱,因而对图谱的解析比较清楚。 ;ESI MS: 电喷雾质谱( electrospray ionisation mass spectrometry )待测分子溶解在溶剂中,以液相方式通过毛细管到达喷口。在高电压作用下形成带电荷的雾滴,随着雾滴中溶剂的蒸发,其表面电场随半径减少而增加,电荷密度不断变大,到达某一临界点时,样品以离子方式蒸发进入气相,从而实现离子化。ESI特点:没有直接的外界能量作用于分子,因此对分子结构破坏较少,是一种典型的“软电离”方式。可形成多电荷离子,因此在较小的m
22、/z范围内可以检测到大分子质量的分子。采用电喷雾质谱目前可测定分子质量100kDa以下的蛋白质,最高可达150kDa。由于采用液相方式进样,可与蛋白质化学中常用的液相色谱联用,即液相色谱-电喷雾质谱 (LC-ESI MS)。在常规电喷雾质谱中,喷雾的过程易形成较大液滴,液滴中的样品分子在离子源就不能完全离子化从而降低了样品的利用率和灵敏度。鉴定与注释蛋白质的路线:通过肽指纹图谱(peptide mass fingerprint, PMF)和数据库搜寻匹配通过检测样品中部分肽段的二级质谱信息或氨基酸序列标签和数据库搜寻匹配蛋白质数据库:目前应用最普遍的数据库是NRDB和dbEST 数据库。NRD
23、B 由SWISS-PROT 和GENPETP等几个数据库组成;dbEST是由美国国家生物技术信息中心(NCBI)和欧洲生物信息学研究所(EBI)共同编辑,包括大量肽序列标签(PST)。SWISS-PROT(http:/www.expasy.org)拥有目前世界上最大的蛋白质组学数据库。PMF或二级质谱匹配检索常用搜索引擎-MASCOT()抗体芯片:可用于研究在不同生理状态或病理状态下蛋白水平的量变。优点:微型化,集成化,高通量化。如肿瘤标志物抗体芯片等。常用荧光标记:Cy5和Cy3等。酵母双杂交系统(Yeast two-hybrid system):典型的真核转录因子都含有二个结构域: DNA
24、结合结构域(DNA binding domain,DNA-BD)和转录激活结构域(activation domain,AD)。二个结构域功能上相互独立又互相依赖,只有结合才具完整活性。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白蛋白的相互作用。 利用酵母双杂交技术筛选新的相互作用蛋白:1)DNA-BD + Bait protein;2)AD + cDNA文库的基因。将阳性反应的酵母菌株中的 AD-LIBRARY载体提取分离出来,从而对载体中插入的文库基因进行测序和分析,研究与已知基因在生物学功能上的联系。第4章 基因工程基因工程(gene engineering):又称为重组DNA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 分子生物学 整理 笔记 29
限制150内