基于PubMed开发的大数据分析工具在科研中的应课件.ppt
《基于PubMed开发的大数据分析工具在科研中的应课件.ppt》由会员分享,可在线阅读,更多相关《基于PubMed开发的大数据分析工具在科研中的应课件.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于PubMed开发的大数据 分析工具在科研中的应用引言:我们进入了大数据时代 “在洛杉矶,警方通过数据分析,预测12小时内哪个地区最有可能发生犯罪;在伦敦金融城,一位交易员认为,数学计算可成为发财”秘笈”;在南美,天文学家尝试为整个宇宙进行分类记录这些迥然不同的领域如今出现同一特征:数据量的大爆发。”这是英国广播公司品牌栏目地平线最新播出的纪录片大数据时代中的开篇一幕。2012年3月29日,美国奥巴马政府宣布推出“大数据研究和发展计划”(Big Data Research and Development Initiative),该计划涉及NSF等6个联邦政府部门,投资超两亿美元,研发采集、组
2、织和分析大数据的工具及技术。有人将其比之为克林顿政府1993年推出的“信息高速公路”计划。美国政府大数据计划的出笼,表明大数据技术已经上升为国家战略。据 IDC(国际数据公司)统计,全球数据量以年均50%的速率增长。2011 年全球所产生的数据总量是 1.8 ZB(10 的 21 次方)1TB(Trillionbyte,太字节)=1024GB 1PB(Petabyte,拍字节)=1024TB 1EB(Exabyte,艾字节)=1024PB 1ZB(Zettabyte,泽字节)=1024 EB=100万PB=10亿TB 但是,对于医生、教师、研究生等专业人员来说,“大数据”的核心资源,依然还是学
3、术文献、统计报告、科技成果等正式出版或规范发布的数据资源。乐友孕婴童运用大数乐友孕婴童运用大数据分析了解顾客的需求据分析了解顾客的需求两个案例 乐友孕婴童运用大数据分析了解顾客的需求,带来大幅的业务增长。乐购通过分析会员卡用户的购物数据,对顾客分类,有针对性地发广告邮件,每年节省 3.5 亿英镑的广告费用。如果我使用数据分析工具,对科题进行分析,能否节约时间和经费?http:/ 1985年,芝加哥大学的Don.R Swanson教授,在研究时偶然发现以雷诺氏病生理改变作为中间词,可将以鱼油和雷诺氏病为主题词分别检索到的两组原本无联系的文献联系起来,得出鱼油有助于雷诺氏病的治疗结论。于是,Swa
4、nson教授提出了基于文献的知识发现(Literature-based Discovery)理论。那么,基于此理论开发的知识发现系统对科研是否有帮助?事实证明,Swanson和Smalheiser开发Arrowsmith分析系统,发现了大量的新知识。2000年,美国情报科学与技术学会(ASIST)因为Swanson独特的情报学方法授予他该学会的最高成就奖。除了Arrowsmith文献分析系统外,常用的文献分析软件还有:HistCite;Bibexcel;SATI;Thomson Data Analyzer;CiteSpace;Pajek;Ucinet;Vosviewer;SPSS;Aureka
5、;RefViz等,以及完全基于PubMed开发的德国的GoPubMed;中国的bdPubMed;美国的Anne OTate、PubFocus以及欧洲的CiteXplore等。基于共词分析技术的Arrowsmith工具可以作为专业人员的科研辅助工具,引导科研人员认识和发现不同科学、不同研究方向之间潜在的有科学价值的信息,以便进一步证实科学假设的可行性。http:/arrowsmith.psych.uic.edu/ArrowsmithArrowsmith知识发现系统简介知识发现系统简介我们以探讨虫草素与肠粘膜屏障功能稳定的潜在相关性研究为例,简单介绍Arrowsmith的使用方法。Arrowsmi
6、thArrowsmith知识发现系统简介知识发现系统简介以虫草素“cordycepinab”的检索结果为文献A集合ArrowsmithArrowsmith知识发现系统简介知识发现系统简介以肠黏膜“Intestinal MucosalTI”的检索结果为文献C集合ArrowsmithArrowsmith知识发现系统简介知识发现系统简介截至2014年10月25日,文献A和C的检索结果分别为795和801篇,A和C之间没有共同的检索词出现,而运用Arrowsmith工具,则A和C文献中共同出现的词语形成的B集合中共有861个词。ArrowsmithArrowsmith知识发现系统简介知识发现系统简介
7、利用Arrowsmith中语义过滤器以“Chemicals&Drugs”、“Genes&Molecular Sequences,and Gene&Protein Names”、“Physiology”进行语义过滤,去除不相关的词。ArrowsmithArrowsmith知识发现系统简介知识发现系统简介根据语义过滤,去除文献B中不相关或相关度小的词。ArrowsmithArrowsmith知识发现系统简介知识发现系统简介结合文献全文发现,蛹虫草对炎性肠病及消化系统疾病高度相关,但用以治疗是否有效,需要在后续的临床研究中加以验证。ArrowsmithArrowsmith知识发现系统简介知识发现系统
8、简介参考:李文林,潘苏华,关洪月.基于Arrowsmith 探讨虫草素与肠粘膜屏障功能稳定的潜在相关性.医学信息,2009,22(12):2684-2687.CiteSpace基于JAVA的可视化文献分析软件 能够显示一个学科或知识域在一定时期发展的趋势、动向及热点,形成若干研究前沿领域的演进历程。http:/cluster.cis.drexel.edu/cchen/citespace/CiteSpaceSPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。GoPubMed系统简介GoPubMed GoPubMed由德国Transinsigh
9、t和德国Technical University Dresden合作开发,该系统的数据库与PubMed检索结果一样。GoPubMed是Gene Ontology(GO)在PubMed数据库中的深度应用。GoPubMed是利用生物信息学相关知识开发的一个可以对PubMed检索结果进行探索、分析的工具/智能搜索引擎。Rules and reasoning for ontology-based literature Rules and reasoning for ontology-based literature searchsearch高度相关的概念各类统计分析各类统计分析Top YearsTop
10、 CountriesTop CitiesTop JournalsTop AuthorsTop TermsGoPubMed系统简介课题发展趋势GoPubMed系统简介地区分布图GoPubMed系统简介作者合作网络GoPubMed系统简介http:/arrowsmith.psych.uic.edu/cgi-bin/arrowsmith_uic/AnneOTate.cgiAnne OTate伊利诺伊大学芝加哥分校开发Anne OTate对PubMed检索结果按照重要的单词、MeSH主题、所属单位、作者姓名、期刊和出版年进行分组,点击给定的分类名称即可显示该类别中的所有文章。http:/cbdm.md
11、c-berlin.de/medlineranker/cms/medline-rankermedline-ranker 马克斯德尔布吕克分子医学中心开发medline-ranker与用户输入的某个主题相比较,自动推断出一组非常有判断力的单词,用这些单词对相关的文章进行评分和排序。PubFocus可以按照期刊的影响因子、作者的贡献水平等多种因素对文献进行排序,用户可能找到某一学科或某个领域内的最有影响力或最多产出的作者,或是了解在某学校领域内哪种期刊发表的文章最多。PubFocusPubFocus 南加州大学洛杉矶分校开发 本地本地PubMedPubMed检索系统是华中科技大学同济医学院与济检索系
12、统是华中科技大学同济医学院与济南泉方科技有限公司合作开发的本地化数据库产品,本检索系南泉方科技有限公司合作开发的本地化数据库产品,本检索系统产品是在美国统产品是在美国PubMedPubMed的基础上,参考的基础上,参考Web of ScienceWeb of Science数数据库、据库、Google ScholarGoogle Scholar谷歌学术搜索、德国的谷歌学术搜索、德国的GoPubMedGoPubMed等,并结合华中科技大学的创新和泉方公司大数据分析技术,等,并结合华中科技大学的创新和泉方公司大数据分析技术,开发出的新一代高水平的外文医学检索平台,为科研和临床提开发出的新一代高水平
13、的外文医学检索平台,为科研和临床提供高效而准确的参考资料。供高效而准确的参考资料。本地PubMed简介本地PubMed简介为什么要本地化?为什么要本地化?2 2011011年,年,20122012年,年,20132013年年均出现过短暂的(有时长达一个月以上)无法均出现过短暂的(有时长达一个月以上)无法正常访问的现象,本地化不受影响。正常访问的现象,本地化不受影响。本地PubMed简介为什么要本地化?医院内部局域网因为安全的为什么要本地化?医院内部局域网因为安全的考虑,一般是不能访问外网的,本地考虑,一般是不能访问外网的,本地P PubMedubMed可以安装在医院内网,方便临床和科研的使用。
14、可以安装在医院内网,方便临床和科研的使用。在期刊的影响因子上,在期刊的影响因子上,参考了参考了SCISCI发布发布的期刊引证报告的期刊引证报告JCRJCR 在被引用的次数上,在被引用的次数上,参考了谷歌学术搜索参考了谷歌学术搜索 GS(Google Scholar)GS(Google Scholar)继承继承PubMedPubMed检检索语法索语法,检索界检索界面及检索结果面及检索结果与与PubMedPubMed一致一致PubMedG&G SCI 在检索结果上增加了在检索结果上增加了 数据分析,并参考了数据分析,并参考了 GoPubMedGoPubMed统计功能统计功能本地PubMed简介为什
15、么要本地化?因为可以提供更加强大的功能!为什么要本地化?因为可以提供更加强大的功能!本地PubMed简介为什么要本地化?因为可以为临床和科研提供帮助!为什么要本地化?因为可以为临床和科研提供帮助!发表于发表于Clin Pharmacol TherClin Pharmacol Ther临床药理学与治疗学临床药理学与治疗学(20102010年度影响因子年度影响因子6.3786.378)中对济南泉方的致谢:中对济南泉方的致谢:AcknowledgmentsAcknowledgmentsWe thank all the staff at Jinan We thank all the staff at
16、Jinan Quanfang Science&Quanfang Science&Technology Technology Co.,Ltd.,for their bibliographic Co.,Ltd.,for their bibliographic retrieval service.retrieval service.发表于国际期刊发表于国际期刊DiabetesDiabetes糖尿糖尿病病(20102010年度影响因子年度影响因子8.8898.889)中对济南泉方的致谢:中对济南泉方的致谢:AcknowledgementsAcknowledgementsWe thank all the
17、 staff at Jinan We thank all the staff at Jinan Quanfang Science&Technology Quanfang Science&Technology Co.,Ltd.,for their bibliographic Co.,Ltd.,for their bibliographic retrieval service.retrieval service.本地PubMed检索系统能够提供更加强大的检索功能,包括联想检索、按IF值过滤以及检索结果的图形化显示等,让检索更加高效,在线的全文申请也更加方便。本地PubMed特色专利所有,侵权必究。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PubMed 开发 数据 分析 工具 科研 中的 课件
限制150内