长足寄蝇生物信息综合数据库的搭建,计算机应用技术论文.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《长足寄蝇生物信息综合数据库的搭建,计算机应用技术论文.docx》由会员分享,可在线阅读,更多相关《长足寄蝇生物信息综合数据库的搭建,计算机应用技术论文.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、长足寄蝇生物信息综合数据库的搭建,计算机应用技术论文现今生物信息技术尤其是在昆虫学领域,迫切需要将生物学基础研究全经过的信息通过计算机技术和手段进行综合存储,同时将生物形态学与分子生物学数据结合起来,根据研究领域的特点和科研成果沟通需要,实现信息沟通与分享、多格式信息存储、生物信息决策与KDD应用等方面信息. 1设计背景 本文以 中国长足寄蝇亚科的系统分类研究 的需求为出发点,以全面合理的存储寄蝇数据、提升现有寄蝇研究成果和数据分享性为目的,力务实现通过计算机手段对国内外寄蝇研究的现有成果进行总结与分类,实现寄蝇信息的高效管理等而搭建长足寄蝇生物信息综合数据库. 相比拟常见的单一数据库形式,该
2、系统的数据仓库由关系数据库和多维数据库共同组建.数据展现平台用Java基于MVC设计形式实现,并将该平台分为Web层、服务层和数据访问层.访问关系数据库数据采用开源的Ibatis框架,将各种SQL语句存放在配置文件中进行统一维护通过JDBC DAO访问关系数据库;同时,对多维数据集访问的脚本语言的也具备Java接口用最实用的C语言.用C后对多维数据库的访问速度则明显改良. 数据存储方面,该系统兼容并济,采用关系形式ROLAP和多维形式MOLAP相结合,即混合形式HOLAP.数据检索方面,针对唯一索引、主键索引和聚集索引3种任取其一均不能知足生物系统海量信息检索的复杂性和高效行,在该系统中采取了
3、唯一索引、主键索引及聚集索引相结合的方式. 2数据存储与检索 系统模型是统一业务系统的核心,模型设计的好坏直接关系到系统建设的成败.在建模时需要将寄蝇亚科研究的现有成果进行存储,并对其进行全面总结、分类和分析. 2.1元数据设计 系统形态学、分子生物学、物种形态信息标准、分类研究历史和生物综合防治和科学考察全经过信息采集等信息根据生物信息化元数据标准建设.包括生物本体53类元数据信息,共515个元数据属性.寄蝇科、亚科、族、属、种的基本研究成果和分类检索成果、物种基本信息和研究历史.包括:形式标本,鉴定和订正已经知道种、发现和记述新种、新纪录种外部形态、绘制头部与外生殖器构造特征图;补充未记载
4、雌性或雄性标本. 27种形态分类描绘叙述属性、分子生物学研究的成果和实验经过.包括:DNA、引物PCR反响图片、测序线粒体COI和28SrRNA基因片断成果与数据、同源分析比对和分子系统树成果等.检视标本采集经过信息、标本管理信息、保存和储存状态和标本分类研究信息和生物形态/生境信息.系统形态分类研究.包括:板图、头胸、腹尾器.其他信息包括寄蝇进化、生态利用和害虫生物控制根据和解决对策、生境特征、科学考察信息、生物地理、自然地理情况(经纬度、行政区位置、海拔、自然区划、地貌、国内/外分布)和研究程度和研究文献等基础生物本体信息. 2.2信息存储类型 信息存储类型有简单文本属性信息、板图图片、实
5、验图片、科考图片、系统发育树研究成果信息对象、基因分子数据大对象格式、统计与热门图形、自定义、分享格式数据、各类格式研究与沟通文档对象等. 生物信息化数据库建库、元数据与采集标准建立.包括中国寄蝇科寄蝇信息数据库元数据标准和生物信息数据采集工作标准与指导方式方法及野外科学考察研究描绘叙述信息. 2.3数据设计与挖掘 系统一共包括53个表,包括5种信息、族属代码、人员权限、公共代码等相关表格.图1所示是族属E-R图,该模型主要描绘叙述了物种的分族、分属情况,以及其国内外分布情况. 图2所示是物种信息E-R图,该模型以物种无主题,主要描绘叙述了和物种信息有关的地域、地貌、生物地理分布等有关信息.
6、3数据挖掘 数据挖掘是指从大量数据中提示出隐藏的、未知的事物的特性或是规律,根据这些规律制定出适宜的算法,然后根据算法进行数据的检索.数据挖掘的功能主要是描绘叙述和预测2方面,包括概念描绘叙述、关联、分类、聚类、演变分析等.以上功能也是现今应用于生物信息数据挖掘的几个主要方面.本系统建设中主要应用聚类、分类和关联分析算法. 3.1聚类分析 本系统使用聚类的目的是:通过聚类分析实现寄蝇分类,进而推断出系统发育树.根据实际情况和需求,由于寄蝇亚科各族属种之间的进化关系本身就是模糊的,相较于划分法、层次法等传统聚类非此即彼的 硬划分 ,模糊聚类的 软划分 显然更适用寄蝇信息数据库.系统聚类的实现决定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内