生物信息学往年题库.pdf
《生物信息学往年题库.pdf》由会员分享,可在线阅读,更多相关《生物信息学往年题库.pdf(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息生物学往年题库 海宁纸牌屋 1 19 1.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A.全局比对通常用于比对 DNA 序列,而局部比对通常用于比对蛋白质序列 B.全局比对允许间隙,而局部比对不允许 C.全局比对寻找全局最大化,而局部比对寻找局部最大化 全局比对比对整体序列,而局部比对寻找最佳匹配子序列 2.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个 BLOSUM 和 PAM 矩阵:BLOSUM45 和 PAM250 B.BLOSUM45 和 PAM 1 C.BLOSUM80 和 PAM250 D.BLOSUM10 和 PAM1 3.与 PAM 打分矩阵比
2、较,BLOSUM 打分矩阵的最大区别是:A.最好用于比对相关性高的蛋白 B.它是基于近相关蛋白的全局多序列比对 它是基于远相关蛋白的局部多序列比对 D.它结合了全局比对和局部比对 4.如果有一段 DNA 序列,它可能编码多少种蛋白质序列:A.1 B.2 C.3 .6 5.要在数据库查询一段与某 DNA 序列编码蛋白质最相似的序列,应选择:A.blastn B.blastp C.tblastn D.tblastp blastx 6.为什么 ClustalW(一个采用了 Feng-Doolittle 渐进比对算法的程序)不报告 E 值:A.ClustalW 报告 E 值 使用了全局比对 C.使用了
3、局部比对 D.因为是多序列比对 7.Feng-Doolittle 方法提出“一旦是空隙,永远是空隙”规则的依据是:A.保证空隙不会引物序列加入而填充 B.假定进化早期分歧的序列有较高优先级别 假定最近序列空隙应该保留 D.假定最远序列空隙应该保留 8.根据分子钟假说:A.所有蛋白质都保持一个相同的恒定进化速率 B.所有蛋白质的进化速率都与化石记录相符合 C.对于每一个给定的蛋白质,分子进化的速率是逐渐减慢的,就如同不准时的钟 对于每一个给定的蛋白质,其分子进化的速率在所有的进化分支上大致是恒定 9.系统发生树的两个特征是:A.进化分支和进化节点 树的拓扑结构和分支长度 C.进化分支和树根 D.
4、序列比对和引导检测方法 10.下列哪一个是基于字母特征的系统发生分析的算法:A.邻位连接法(NJ 法)B.Kimura 算法 最大似然法(ML)D.非加权平均法(UPGMA)信息生物学往年题库 海宁纸牌屋 2 19 11.基于字母特征和基于距离的系统发生分析的算法的基本差异是:基于字母特征的算法没有定义分支序列的中间数据矩阵 B.基于字母特征的算法可应用于 DNA 或者蛋白质序列,而基于距离仅能用于 DNA C.基于字母特征的算法无法运用简约算法 D.基于字母特征的算法的进化分支与进化时间无关 12.一个操作分类单元(OTU)可指:A.多序列比对 蛋白质序列 C.进化分支 D.进化节点 13.
5、构建进化树最直接的错误来源是:多序列比对错误 B.采样的算法差异 C.假设进化分支是单一起源 D.尝试推测基因的进化关系 14.第一个被完整测定的基因组序列是:A.啤酒酵母的 3 号染色体 B.流感病毒 X174 D.人类基因组 15.普通的真核生物线粒体基因组编码大约多少个蛋白质:10 B.100 C.1000 D.10000 16.根据基因组序列预测蛋白质编码基因的算法的最大问题是:A.软件太难使用 .假阳性率太高,许多不是外显子的序列部分被错误指定 C.假阳性率太高,许多不是外显子功能未知 D.假阴性率太高,丢失太多外显子位点 17.HIV 病毒亚型的系统演化研究可以:A.证实 HIV
6、病毒是由牛病毒演化而来 .用于指导开发针对保守蛋白的疫苗 C.证实哪些人类组织最容易遭受病毒侵染 18.一个典型的细菌基因组大小约为多少 bp:A.20000.200000 C.2000000 D.20000000 19.细菌基因组与真核生物基因组分析工具存在较大差异的主要原因是:A.细菌拥有不同的密码子 B.细菌没有细胞核 C.细菌很少有基因与真核同源 细菌 DNA 的基因含量、组成结构很不一样 20.下列具有最小基因组的原核生物可能是:A.嗜极生物 B.病毒 胞内细菌 D.杆菌 21.要证明某大肠杆菌中的某个基因是水平转移而来,需要:A.分析该大肠杆菌中该基因的 GC 含量与其他基因是否有
7、很大差异 B.分析该大肠杆菌中该基因的密码子使用与其他基因是否有很大差异 C.系统发生分析该基因与其他物种中基因的同源关系 获取以上三个方面的信息 信息生物学往年题库 海宁纸牌屋 3 19 22.C 值矛盾是指:A.某些基因组中核苷酸 C 的含量少 B.真核生物基因组大小同编码蛋白质的基因个数没有相关性 真核生物基因组大小同屋中的复杂性相关性很小 D.真核生物基因组大小同进化上的年龄相关性小 23.成百上千个 48bp 的重复序列单元最可能出现在:A.散布性重复序列中 B.假基因中 端粒中 D.片段复制区域 24.从头预测真核基因的原因有:A.外显子/内含子边界难以确定 B.内含子长度可能只有
8、几个碱基对 C.编码区域的 GC 含量并不总是与非编码区相同 以上三个方面的原因 25.人类基因组大小大约是多少 Mb:A.130 B.300 3000 D.30000 26.各种重复元件在人类基因组中大约占的百分比为:A.5%B.25%50%D.95%27.蛋白质编码区域占人类基因组百分比是:1-5%B.5-10%C.10-20%D.20-4-%28.人类基因组中 GC 含量高的区域:A.基因密度相对较低 基因密度相对较高 C.基因密度多变 D.基因所含密码子相对较少 29.人类复合孟德尔遗传的基因疾病约占疾病基因的:1%B.10%C.50%D.60%30.单基因疾病趋向于:在普通人群较少见
9、,并且发生时间较早 B.在普通人群较常见,并且发生时间较早 C.在普通人群较少见,并且发生时间较晚 D.在普通人群较常见,并且发生时间较晚 43.UTR 的含义是(B)。A.编码区 B.非编码区 C.低复杂度区域 D.开放阅读框 44.motif 的含义是(D)。A.基序 B.跨叠克隆群 C.碱基对 D.结构域 45.algorithm 的含义是(B)。A.登录号 B.算法 C.比对 D.类推 46、RGP 是(D)。A.在线人类孟德尔遗传数据 B.国家核酸数据库 C.人类基因组计划 D.水稻基因组计划 信息生物学往年题库 海宁纸牌屋 4 19 47、下列 Fasta 格式正确的是(B)。A.
10、seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B.seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C.seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D.seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 48、如果我们试图做蛋白质亚细胞定位分析,应使用(D)。A.N
11、DB 数据库 B.PDB 数据库 C.GenBank 数据库 D.SWISS-PROT 数据库 49、Bioinformatics 的含义是(A)。A.生物信息学 B.基因组学 C.蛋白质组学 D.表观遗传学 50、GenBank 中分类码 PLN 表示是(D)。A.哺乳类序列 B.细菌序列 C.噬菌体序列 D.植物、真菌和藻类序列 51、ortholog 的含义是(A)。A.直系同源 B.旁系同源 C.直接进化 D.间接进化 52、从 cDNA 文库中获得的短序列是(D)。A.STS B.UTR C.CDS D.EST 53、contig 的含义是(B)。A.基序 B.跨叠克隆群 C.碱基对
12、 D.结构域 54、TAIR(AtDB)数据库是(C)。A.线虫基因组 B.果蝇基因组 C.拟南芥数据库 D.大肠杆菌基因组 55、ORF 的含义是(D)。A.调控区 B.非编码 C.低复杂度区域 D.开放阅读框 56、mRNA 5端有(A)结构。A.帽子 B.尾巴 C.帽子和尾巴 D.多聚核苷酸 57、利用中国知网文献数据库(中国知网)查找论文题目是“扩张蛋白家族蛋白序列分析”发表在期刊“生物信息学”2008 年第 7 卷第 3 期上(C)。A.第 3-5 页 B.第 93-95 页 C.第 193-195 页 D.第 293-295 页 58、目前应用于基因芯片表达数据统计分析的主要方法是
13、(C)。A.卡方检验 B.相关分析 C.聚类分析 D.正态性分布检验 59、SAGE 的含义是(A)。A.基因表达连续分析 B.聚丙烯酰胺凝胶电泳 C.基因组分析 D.双向电泳分析 信息生物学往年题库 海宁纸牌屋 5 19 60、domain 的含义是(D)。A.基序 B.跨叠克隆群 C.碱基对 D.结构域 61、mRNA 3端有(B)结构。A.帽子 B.尾巴 C.帽子和尾巴 D.多聚胞嘧啶 62、NCBI 中人类无冗余基因数据库是(A)。A.UniGene B.UniPro C.UniRef D.URF 63、alignment 的含义是(C)。A.登录号 B.算法 C.比对 D.类推 64
14、、Entrez 使用几种逻辑运算符对检索关键词做最基本的限制?(C)A.1 种 B.2 种 C.3 种 D.4 种 65、微卫星标记是(C)。A.RFLP B.SNP C.SSR D.RAPD 66、提交序列到 GenBank 中,使用的程序可以是(D)。A.Entrez B.SRS C.Medline D.BankIt 67、PDB 是蛋白质的(B)。A.分类数据库 B.结构数据库 C.模体数据库 D.结构域数据库 68、限制性片段长度多态性标记是(A)。A.RFLP B.SNP C.SSR D.RAPD 69、CDS 的含义是(A)。A.编码区 B.非编码区 C.低复杂度区域 D.非调控区
15、 70、构建进化树工具是(C)。A.BLAST B.ClustalW C.Mega D.GCG 71、analogy 的含义是(D)。A.登录号 B.算法 C.比对 D.类推 72、在真核生物中,一个基因 cDNA 的 5端起始密码子 AUG 的前后序列符合(A)规则。A.Kozak B.AUAG C.SD D.Poly(A)n 73、将核酸序列按照 6 条链翻译成蛋白质序列后搜索蛋白质序列数据库使用的程序是(B)。A.blastp B.blastx C.tblastn D.tblastx 74、利用 PubMed 文献数据查找论文“Transgenic plants of Petunia h
16、ybrida harboring the CYP2E1 gene efficiently remove benzene and toluene pollutants and improve resistance to formaldehyde”的第一作者是(D)。A.Xiang T B.Bao L C.Li P D.Zhang D 信息生物学往年题库 海宁纸牌屋 6 19 75、基本局部比对搜素工具是(C)。A.Mega B.ClustalW C.BLAST D.GCG 76、被誉为“生物信息学之父”的科学家是(D)。A.Dulbecco B.Sanger C.吴瑞 D.林华安 77、DDBJ
17、 的含义是(C)。A.美国国家生物信息中心 B.欧洲分子生物学实验室 C.日本 DNA 数据库 D.中国基因组研究中心 78、利用 PubMed 文献数据查找发表在“Nature,2012,487(7405):43-45”上论文题目(D)。A.A map of the cis-regulatory sequences in the mouse genome B.The human CST complex is a terminator of telomerase activity C.Tumours:Less lactation may explain cancer rise D.Stem c
18、ells:a sporadic super state 79、利用 PubMed 文献数据查找论文“Cancer epigenetics:from mechanism to therapy”作者的单位是(C)。A.University of California B.University of Columbia C.University of Cambridge D.University of Chicago 80、单核苷酸标记是(A)。A.RFLP B.SNP C.SSR D.RAPD 81、GenBank 数据库的基本信息单位是(B)。A.FASTA B.GBFF C.GCG D.ASN.
19、1 82、OMIM 是(A)。A.在线人类孟德尔遗传数据库 B.国家核酸数据库 C.人类基因组计划 D.水稻基因组计划 83、多序列比对工具是(B)。A.BLAST B.ClustalW C.Mega D.GCG 84、EMBL 的含义是(B)。A.美国国家生物信息中心 B.欧洲分子生物学实验室 C.日本 DNA 数据库 D.中国国家基因组研究中心 85、accession number 的含义是(A)。A.登录号 B.算法 C.比对 D.类推 86、EST 的含义是(A)。A.表达序列标签 B.序列标签位点 C.高通量基因组序列 D.人工合成序列 信息生物学往年题库 海宁纸牌屋 7 19 8
20、7、利用中国知网文献数据库(中国知网)查找论文题目是“黄瓜对不同温度逆境的抗性研究”作者的单位是(A)。A.天津市黄瓜研究所 B.中国农业科学院 C.中国科学院 D.中国农业大学 88、没有直接参与完成人类基因组计划的国家是(C)。A.英国 B.中国 C.俄罗斯 D.德国 89、Blast 结果中 HSP 的含义是(D)。A.空位 B.期望值 C.过滤 D.高分配对片段 90、GenBank 登录号为 SCU49845 的序列,其 DNA 产度是(D)。A.1028 bp B.3028 bp C.4028 bp D.5028 bp 91、GenBank 数据库中的登录号 AAR19268 是(
21、A)。A.水稻的 DNA 序列 B.水稻的蛋白质序列 C.人类的 DNA 序列 D.人类的蛋白质序列 92、在真核生物的一个基因内含子两端,即外显子/内含子拼接边界处,其符合(B)规则。A.Kozak B.AUAG C.SD D.Poly(A)n 93、蛋白质信号肽的预测工具有(D)。A.nnpredict B.PredictProtein C.SingalD D.SingalP 94、base pair 的含义是(C)。A.基序 B.跨叠克隆群 C.碱基对 D.结构域 95、Proteomics 的含义是(C)。A.生物信息学 B.基因组学 C.蛋白质组学 D.表观遗传学 96、根据大量 E
22、ST 具有相互重叠的性质,通过计算机算法获得 cDNA 全长序列,这种克隆基因的方法是(B)。A.重叠克隆 B.电子克隆 C.基因步移 D.基因重组 97、隐马尔科夫模型的代号是(A)。A.HMM B.CDD C.HTGS D.GSS 98、Entrez 数据库中的剪贴板的容量是(A)。A.500 条记录 B.1000 条记录 C.5000 条记录 D.10000 条记录 99、GenBank 是(B)。A.在线人类孟德尔遗传数据 B.国际核酸数据库 C.人类基因组计划 D.水稻基因组计划 100、利用中国知网文献数据库(中国知网)查找论文题目是“黄瓜无毛突变体叶片叶绿体超微结构与光合特性”第
23、一作者是(A)。A.曹辰兴 B.张松 C.郭红芸 D.郭延奎 101、根据研究发现,人类基因组中真正编码蛋白质的区域仅占 DNA 序列的(B)。信息生物学往年题库 海宁纸牌屋 8 19 A.1-2%B.3-5%C.5-10%D.10-20%102、LCR 的含义是(C)。A.编码区 B.非编码区 C.低复杂度区域 D.开放阅读框 103、如果我们试图做蛋白质亚细胞定位分析,应使用(D)。A.NDB 数据库 B.PDB 数据库 C.GenBank 数据库 D.SWISS-PROT 数据库 104、利用 PubMed 文献数据查找论文“A whole-cell computational mode
24、l predicts phenotype from genotype”发表在 Cell 期刊的(C)。A.第 50 卷第 1 期第 389-391 页 B.第 50 卷第 1 期第 389-401 页 C.第 150 卷第 2 期第 389-401 页 D.第 125 卷第 2 期第 389-391 页 105、蛋白质基序(motif)中ST的含义是(C)。A.氨基酸为 ST B.氨基酸为 S 和 T C.氨基酸为 S 或 T D.除掉 S 和 T 之外的任意氨基酸 106、构建系统发生树,应使用(C)。A.BLAST B.FASTA C.UPGMA D.FTP 107、PIR 是(D)。A.
25、核酸数据库 B.mRNA 数据库 C.启动子数据库 D.蛋白质数据库 108、生物芯片分析中使用的聚类分析输出图形主要以下列哪种方式表现?(A)A.以彩色小方块阵列表示 B.以蜂窝形状表示 C.以黑白圆点表示 D.以彩色线条表示 109、以下哪一项不属于启动子研究范围?(A)A.CpG 岛预测 B.转录起始点预测 C.糖基化修饰 D.甲基化检测 110、生物信息学主要是利用哪种工具实现对生命科学研究中生物信息的存储、检索和分析的?(A)A.计算机 B.iPhone C.人造卫星 D.手机 111、HTGS 的含义是(C)。A.表达序列标签 B.序列标签位 C.高通量基因组序列 D.人工合成序列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 往年 题库
限制150内