高通量测序技术及其应用.doc
《高通量测序技术及其应用.doc》由会员分享,可在线阅读,更多相关《高通量测序技术及其应用.doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中国生物工程杂志 China Biotechnology, 2012, 32( 1) : 109-114 高 通 量 测 序 技 术 及 其 应 用 * 王兴春 杨致荣 王 敏 李 玮 李生才 2 ( 1 山西农业大学生命科学学院 ( 3 太谷 030801 2 山西农业大学农学院 030801) 太谷 030801) 山西农业大学文理学院 太谷 摘要 高通量测序技术是 DNA 测序发展历程的一个里程碑,它为现代生命科学研究提供了前所 未有的机遇 。 详细介绍了以 454、 Solexa 和 SOLiD 为代表的第二代高通量测序技术,以 HeliScope TIRM 和 Pacific Bio
2、sciences SMRT 为代表的单分子测 序技术,以及最近 Life Science 公司推出 的 Ion Personal Genome Machine ( PGM) 测序技术等高通量测序技术的最新进展 。 在此基础上,阐述 了高通量测序技术在基因组测序 、 转录组测序 、 基因表达调控 、 转录因子结合位点的检测以及甲 基化等研究领域的应用 。 最后,讨论了高通量测序技术在成本和后续数据分析等方面存在的问 题及其未来的发展前景 。 关键词 高通量测序 深度测序 下一代测序 基因组测序 转录组测序 中图分类号 Q3 作为最重要的分子生物学分 析 方法之一 , DNA 测 序不仅为遗传信息
3、的揭示和基因表达调控等基础生物 学研究提供重要数据 , 而且在基因 诊断和基因 治疗等 应用研究中也发 挥着重要的 作用 。 随着科 学的发展 , 传统的 Sanger 测序技术 的局限性日 益突出 。 一方面 , 该技术依赖于毛细管电泳 , 不但费时 , 而且测序反应数 也受到限制 ( 目前常用的 ABI 3730 测序仪每次只能分 析 96 个样品 ) ; 另一方面 , 该技 术基于酶法测序 , 成本 较高 。 自 2005 年 以 来 , 以 Roche 公 司 的 454 技 术 、 Illumina 公司的 Solexa 技术和 ABI 公司的 SOLiD 技术 为标志的高通量测序技
4、术相继诞生 。 虽然高通量测序 技术建立的时间 不长 , 但发展 非常快 。 已经应 用于基 因组 包括测序和表观 基因组学以 及功能基因 组学研 , 究的许多方面 。 高通量测序技术已经将人们带到了 真正的高通量测序时 代 , 这些技术 必将在生命 科学领 域得到广泛的应用 , 并产生极大的推动作用 。 然而 , 许 多科研人员仅知道高 通量测序技 术的大概原 理 , 而对 于该技术在生命 科学领域的 应用却知 之甚少 。 为 此 , 本文详细阐述了高通量测序技 术的最新进展及其在生 收稿日期 : 2011-04 -11 修回日期 : 2011-06 -02 * 山西省青年 科技 研究 基金
5、 ( 2010021030-1) 、 国家自 然科 学基 金 ( 31100235) 资助项目 通讯作者 电子信箱 , : wxingchun 163 com; sxaulsc126 com 命科学研究中的 应用 , 以期使 科研工作者 尽早地了 解 该技术 并将其更好地应用到科研工作中 , 。 1 高通量 测序技术及其发展现状 高通量测序技术堪称测序技术发展历程的一个里 程碑 , 该技术 可以 对数 百万 个 DNA 分 子进 行 同时 测 序 。 这使得对一个物种的转录组和基因组进行细致全 貌的分 析 成 为 可 能 , 因 此 也 称 其 为 深 度 测 序 ( deep sequenc
6、ing) 或 下 一 代 测 序 技 术 ( next generation sequencing, NGS) 。 目前 , 所说的高通量测序技术主 要是指 454 Life Sciences 公 司 、 ABI 公司和 Illumina 公 司推出的 第二 代测 序技 术 以及 Helicos Heliscope 和 Pacific Biosciences 推出的单分子测序技术 。 1 1 第二代测序技术 2005 年 , 454 Life Sciences 公司 ( 现已被 Roche 公司 收购 ) 首先推出了革命性 的基于焦磷 酸测序法的超 高 通量基因组测序系统 , 开创了第二代测序
7、技术的先河 。 该技术的原理是酶级联化学发光反应 : 首先 将 PCR 扩 增的单链 DNA 与引物杂交 , 并与 DNA 聚合酶 、 ATP 硫 酸化酶 、 荧光素酶 、 三 磷酸腺苷双 磷酸酶 、 底物荧光 素 酶和 5-磷酸硫酸腺苷共同孵育 。 在每一轮测序反应中 只加入一种 dNTP, 若该 dNTP 与模板配对 , 聚合酶就可 1, 2 3 1 1 1 110 中国生物工程杂志 China Biotechnology 。 Vol 32 No 1 2012 PCR 以将其掺入到引物 链中并释放出 等摩尔数 的焦磷酸 ATP, ATP 技术完全摒弃了上述测序平台所基于的 , 扩增的信 。
8、 焦磷酸盐被硫酸化酶 转化为 。 CCD 就会促 使氧合 号放大过程 : 真正达到了读 取单分子 荧光的 能力 , DNA 具 , 荧光素的合成并释放可见光 , 检测后通过软件转 体原理为 首先 将待测 样品随机打断成小片段 poly-dA; , 化为一个峰值 4 峰值与 反应中掺入 的核苷酸数 目成正 在每个 小 片 段 的末 端 加 上 然 后 将 小 片 段 比 。 此后 , Illumina 公 司 和 ABI 公 司 相 继 推 出 了 DNA 模板与固定在检测芯 片上的 poly-dT 引物 进行杂 Solexa 和 SOLiD ( supported oligo ligation
9、 detetion) 测 交并精确定 位 , 并 逐一 加入 荧光 标记的 末端 终止 子 。 序技术 。 它们与焦磷酸测 序法的原 理类似 , 核心思想 , 、 , 都是边合成边测序 ( sequencing by synthesis) , 即生成新 在掺入了单个荧 光标记的核 苷酸后 , 、 洗 涤 , 成像 之 后 DNA 互补链时 , 要么加入的 dNTP 通过酶促 级联反应 切开荧光染料和 抑制基团 。 洗 涤 、 加帽 允 许下一个 核 , 催化底 物 激发 出 荧光 , 要 么直 接 加 入被 荧 光 标 记的 苷酸的掺入 这样通过掺入 。 检测和切除的反复循环 , 即可实时 读
10、 取 大 量 序 列 随 后 他 们利 用 该 技 术 对 dNTP 或半简并引物 在合成或连接生成互补链时释 放 , M13 基因组进行重测序 。 M13 噬菌体是一种单链 DNA 出荧光信号 , 。 通过 捕获 光 信号 并转 化为 一 个测 序峰 。 病毒 , 基因组全长 , 6 407 个核 苷酸 。 他们共 获得了 。 28 值 获得互补链序列 信息 , 由此可见 第二代测 序技术 。 万条序列 开 创了单分子高 通量测序 的先河 , Pacific Biosciences 这之 后 无需进行电泳 , 操 作极为简便 这不 但大大节 省了成 。 不久 公司又开发出了另一种单分子 (
11、single molecule real 本和时间 而且可 以在芯片上 进行高通 量分析 该测 , 测序 技 术 time, SMRT) 单 分 子 实 时 技 术 。 DNA 序技术单次反应可 以对数以百万 计的样品 进行分析 该技术利用单分子技术和 聚合 这样庞大的测序能力是传统测序仪所不能比拟的 。 , 假 酶 , 在聚合反应的同时就可以读取测序产物 、 。 SMRT 测 如利用这种方法进行 人类基因组 的测序 , 。 那么 在数天 序技术在测序速 度 。 读长和成 本方面有着 巨大的优 势 3bp / s, 内就可以完成 而且成本也将大大降低 Illumina , 和潜力 2013 虽
12、然目前的读取速度为 min 但他们声称将 。 公 司 目 前 拥 有 三 种 测 序 平 台 分 别 为 在 年前实现三 测完人类基因组的目标 从而 HiSeq 2000、 HiSeq 1000、 Genome Analyzer IIx ( http : / / www illumina com / ) ; ABI 公 司则 主 要是 SOLiD 3 和 又向 大步 1 000 。 美元测定 一个人类基因组的目标迈 出了一 SOLiD 4 两个测序平台 200G 。 HiSeq 2000 , SOLiD 4 测序平台 单次反 100G 。 1 3 Ion PGM Sanger 测序技术 , 应
13、可以读取 的数据 而 仅为 , HiSeq 2000 左右 与 双脱氧 链终止法测序技术相比 上 述测 。 从通量这 个 最 直 观 的 数字 看 来 SOLiD 4 。 领 先 于 , 序技术在测序 速度和成本方 面都有了革 命性的 变革 , 。 , Helico 更 高 的 通 量 就 意 味 着 更 低 的 成 本 利 用 但 是 测 序 仪 的 价 格 非 常 昂 贵 例 如 目 前 HiSeq 2000 , 以 30 倍的覆盖度对两个人类基因组进行测 1 ( http: / /www BioScience 公司的 HeliScope 测序 仪售价近 百万美 元 , 序 每 个 基 因
14、 组 的费 用 不 到 万 美 元 这是一般实验室和科研单位所不能承受的 。 2010 年年 illumina com / systems /hiseq _2000 ilmn) 。 , 454 , 就 测序 读长 400 nt。 底 , Life Techologies 公 司 推出 的 Ion Machine ( PGM ) Personal Genome 1 / 来说 , 454 测序平台读长最长 目前已经达到 , 因 10, 测 序仪价 格仅 为普 通测 序仪 的 。 Ion PGM 此 平台比较 适合对未知基因组从 头测序 。 Solexa 但是在 很好的解决了这一问题 , 测序仪的设
15、计是 5 6 8 TM 判断连续单碱基重复区时准确度 不高 454 , 100nt , 、 测序读 , 基于半导 体 芯片 技 术 DNA , 在 半 导 体芯 片 的 微孔 中 固 定 ACGT。 , 长较 短 仅为 左右 。 SOLiD 但测序 通量高 , 价位低 链 随后依次掺入 , 随着每个 碱基的掺入 。 适合基因组重测序等 读长也较短 但测序精度 释放出氢离子 在它们穿过每个孔底部时能被检测到 , 、 较高 , 特别适合 SNP 检测等 。 与其它新一代测序仪相比 , 。 它不需要激光 照相机或标 、 1 2 单分子测序技术 记 价格当然要便宜很多 这种独特的流体体系 , 微体 在
16、第二代测序 平台不断完善 和广泛应 用的同时 , 系机械设计和半 导体技术的 组合 2 h 10Mb 1Gb 使得研 究人员能 够 以对单分子 DNA 进行非 PCR 测序为主要特征的更新 在 内 获 取 从 到 以 上 高 精 确 度 序 列 的 测 序 技 术 也 初 显 端 倪 。 2008 7 年 4 月 , Helico ( http: / / www iontorrent com / products-ion-pgm /) 。 BioScience 公司的 Harris 等 在 Science 上报道 了他们 1 4 高通量测序技术的优点 开发的 基 于 全 内 反 射 显 微 镜
17、 ( total Internal reflection 高通量测序技术有三大优点是传统 Sanger 测序法 microscopy, TIRM) 的测序技术 单分子测序 技术 。该 所不具备的 。 第一 , 它利用芯片进行测序 , 可以在数百 2012, 32( 1) , 王兴春 等 : 高通量测序技术及其应用 , 2 2 RNA 111 万个点上同时阅读测序 把平行处理的思想用到极致 ( massively parallel 高通量 测序及其在转录组和基因表达调控 因此 也 称 之 为 大 规 模 平 行 测 序 signature sequencing, MPSS) , 这一点是 大家所
18、熟知的 , , 。 , 研究中的应用 转录组研究是基因功能及结构研究的基础和出发 。 第二 高通量测序技术有完美的定量功能 这是因为样 点 是全基因组 测序完成后 首先要面 对的问 题 最 近 品中某种 DNA 被测序的次 数反映了样 品中这种 DNA 的丰度 。 这一点有望取代以前的基因表达芯片技术用 于基因表达的研究 。 第三 , 成本低廉 。 利用传统 Sanger 测序法完 成的人类基因组计划总计耗资 27 亿美元 , 虽 然比预计的 30 亿美元节省了不少 , 但仍是一个耗资巨 大的工程 。 而现在利用高通量测序技术进行人类基因 组测序 , 耗资不到传统测序法的 1% 。 2 高通量
19、测序技术的应用 高通量测序技 术的迅猛发展 , 将基因组学 水平的 研究带入了一个新的 时期 , 也使经 典分子生物 科学家 对基因组学的认识和思考上升到一个新的水平 。 高通 量测序技术不仅可以 进行大规模 基因组测序 , 还可用 于基因表达分析 、 非 编码小 分子 RNA 的鉴 定 、 转录因 子靶基因的筛选和 DNA 甲 基化等相关研究 。 2 1 高通量测序技术在全基因组测序中的应用 全基因组测序 对全面了解一 个物种的 分子进化 、 基因组成和基因 调控等有着 非常重要 的意义 。 但 是 , 高通量测序技术在发 展初期由于 读长较短 , 使其在对 未知基因组从头测序 ( de n
20、ovo Sequencing) 的应用受到 限制 , 只能用于基 因组重测序 。 基因 组重测序 是指对 已知基因组序列的 物种进行不同 个体的基 因组测序 , 并在此基础上对个体或群体进行差异性分析 。 2008 年 4 月 17 日的 Nature 杂志上 , 美 国的 科学家发表了首个 利用新一代高通量测 序技术得到 的人类全基 因组 , 这 个基因组正是 “DNA 之父 ”James D Watson 的 。 整 个测序 过 程在 2 个 月内 就 完成 了 , 花 费不 到 100 万 美元 。 随着高通量测 序技术的不断 完善 , 独立应 用该技 术进行全 基因组从头 测序成为可能
21、 。 2010 年 1 月 21 日 , 由深圳华大基因研究院发起 , 中国科学院昆明动物 研究所 、 中国科学院动物研究所 、 成都大熊猫繁育研究 基地和中国保护大熊猫研究中心参与的大熊猫基因组 测序成 果 以 封 面 文 章 的 形 式 发 表 在 国际 权 威 杂 志 Nature 上 。 这是全球第一个完全使用高通量测序技 术完成的基因组序列图 。 科学家们将高通量测序技术应用于转录组分析开发出 了 RNA 测序技术 ( RNA-Seq) , 该技术能够在全 基因组 范围内检测 基因 表达 情况 , 进行 差异基 因筛 选分 析 。 由于 RNA-Seq 技术具有通量高 、 可重复性高
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通量 技术 及其 应用
限制150内