医疗大数据分析应用平台(DOC84)50043.doc
《医疗大数据分析应用平台(DOC84)50043.doc》由会员分享,可在线阅读,更多相关《医疗大数据分析应用平台(DOC84)50043.doc(131页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Evaluation Warning: The document was created with Spire.Doc for .NET. 医疗大数据分析应用平台医疗大数据分析析应用平台产产品解决方案案(初稿)本应用平台产品品的总体方案案思路是:基基于目前医疗疗服务机构及及相关机构已已有的HLI、NHLI、HIS等有关系统统形成并积累累的医药医疗疗大数据和信信息,采用最最新的大数据据技术、云计计算技术、BI和数据挖掘掘技术,形成成对医疗行业业具有新视角角、全方位、智智能性、预测测性、可视性性的深层次展展示分析效果果(Insigght),揭示医医疗行业整体体规律和内在在发展趋势,揭揭示患者个体体
2、的独有特质质并形成个性性医疗,将医医疗行业的宏宏观大势与每每个患者的微微观个体定性性定量描述有有机结合,达达到支撑和形形成医疗行业业新应用场景景和新服务模模式。“医药医疗大大数据”是具有更强强的决策力、洞洞察发现力和和流程优化能能力的海量、高高增长率和多多样化的信息息资产,但需需要新计算处处理模式。1. 背景介绍根据国际著名分分析机构Gartnner给出的定义义:大数据就就是那些具有有规模大、速速度快、种类类多三大特征征的数据资产产。大数据分分析从海量数数据中筛选出出有用的信息息,然后通过过各种手段将将信息转化为为洞察力,从从而做出正确确决策,并最最终推动业务务发展。通过过一系列分析析处理,大
3、数数据可以帮助助企业制定明明智且切实可可行的战略,获获取前所未有有的客户洞察察,支持客户户购买行为,并并构建新的业业务模式,进进而赢得竞争争优势。随着人们的生活活水平不断提提高,健康也也越来越受到到家庭的关注注。20099 年2 月27 日,我我国卫生部公公布的第四次次国家卫生服服务调查结果果显示,截止止至20088 年,我国国居民脑血栓栓,糖尿病,高高血压等慢性性病病例数达达到2.6亿,占全国国总人数的220%,其中中高血压病人人对自身疾病病的知晓率只只有30%,同时时这些病人中中的治疗率只只有25%,控制制率仅为6%,糖尿病病病人中,能坚坚持做到规范范治疗的也只只有33%。由此此我们可以看
4、看出,建立科科学、规范、高高质量的慢性性病管理策略略,实现对人人体慢性病的的监护具有重重大的意义。通通过慢性病的的早期诊断和和监护,不仅仅能提前预防防和控制各种种疾病,还能能帮助他们合合理用药,减减少医药开支支。另一方面面,我国公共共医疗卫生资资源紧缺,城城乡医疗卫生生资源的差距距比较大,城城市人口平均均拥有的医疗疗卫生资源是是农村人口的的2.5倍以上,比比如,占全国国总人口近770%的农村村拥有全国医医疗卫生资源源的30%,而占占全国总人口口30%的城市市却占有全国国医疗卫生资资源的70%,优质的医医疗卫生资源源集中分布在在城市,尤其其是大城市。因因此,实现城城乡之间的医医疗卫生资源源共享成
5、为丞丞待解决的重重要问题。同时,随着国家家积极倡导“3521”医疗系统建建设,我国医医疗领域信息息化程度得到到了很大的提提高,预计在在全国会出现现上百个医疗疗数据中心,每每个数据中心心都将承载近近1000 万人口的医医疗数据,数数量多、更新新快且类型繁繁杂,使医院院数据库的信信息容量不断断膨胀,这就就产生了医疗疗大数据。医医疗大数据通通常具有以下下特征:(1) 数据巨巨量化: 区域医疗疗数据通常是是来自于拥有有上百万人口口和上百家医医疗机构的区区域,并且数数据呈持续增增长的趋势。依依照医疗行业业的相关规定定,患者的数数据通常至少少需要保留550 年。(2) 服务实实时性: 医疗信息息服务中会存
6、存在大量在线线或实时数据据分析处理的的需求。例如如: 临床中的的诊断和用药药建议、健康康指标预警等等。(3) 存储形形式多样化: 医疗数据据的存储形式式多种多样,例例如各种结构构化数据表、非非( 半) 结构化文文本文档、医医疗影像等。(4) 高价值值性: 医疗数据据对国家乃至至全球的疾病病防控、新药药研发和顽疾疾攻克都有着着巨大的作用用。因此,如何在海海量的医疗大大数据中提取取信息的能力力正快速成为为战略性发展展的方向,通通过大数据分分析挖掘出有有价值的信息息,将对疾病病的管理、控控制和医疗研研究都有着非非常高的价值值。大数据将给医疗卫生带来的益处强化管理,降低成本,提高效益为医疗卫生事故防控
7、,赢得时间实现对医疗卫生早期预警有助于实现医疗卫生溯源从大数据中发现科学,提升决策能力和水平目前,大数据、云云计算是已经经普及并成为为IT 行业的的主流技术。国国内外都已经经进入了大数数据、云计算算的研究热潮潮,同时大数数据、云计算算技术也逐渐渐成熟,大规规模区域医疗疗信息系统和和大型数据中中心的建立也也在同时进行行。而云计算算是大数据成成长的驱动力力,与此同时时,由于医药药医疗大数据据越来越多,对对云计算的需需求日益增长长,所以二者者是相辅相成成的。随着医医疗数据的急急剧增长,如如何充分利用用这些数据,运运用大数据、云云计算技术,搭搭建合理先进进的数据云服服务平台,为为广大患者、医医务人员、
8、科科研人员提供供服务和协助助,必将成为为未来信息化化工作的重要要方向。“大数据时代”已经降临,“大数据”正在对每个个领域都造成成影响。在商商业、经济及及其他领域中中,决策行为为将日益基于于数据和分析析的结果,而而非基于经验验和直觉;而而在公共卫生生、经济发展展和经济预测测等领域中,“大数据”的预见能力力也已经崭露露头角。20012年3月,美国政政府公布了“大数据研发发计划”(Big DData RResearrch and DDeveloopmentt Inittiativve)。该计计划的目标是是改进人们从从现有的海量量和复杂的数数据中获取知知识的能力。其其中,与医疗疗卫生领域相相关的有生物
9、物传感2.00、虚拟实验验室环境(VVLE)、癌癌症基因组图图谱(TCGA)、神经科学学信息框架(NIF)、患患者报告结果果测量信息系系统(PROMIIS) 等10 余项。20114年美国的公公共数据开放放项目OpenFFDA上线之后,先先导项目开放放了“300万份药物不不良反应报告告”,这些数据据是2004至2013年间被提交交给FDA的药物不良良反应和医疗疗过失记录。对对医疗机构来来说,不良反反应和医疗过过失记录起到到的是长远的的贡献作用,能能减少医疗悲悲剧的重现。根据我国居民第第三次死因调调查报告显示示,脑血管病病已成为居民民的第一死因因。脑卒中发发病率正以每每年8.7%的速率上升升,我
10、国每年年用于治疗脑脑血管病的费费用约在100亿元以上。2014年,GE医疗中国联联合国家卫生生计生委脑卒卒中防治工程程委员会(脑防委)启动了“脑卒中行动”合作战略。GE医疗“脑卒中行动”的法宝之一一就是大数据据。尤其是GE构建的三级级筛查网络,对对双侧内膜增增厚的高危人人群检出率提提升了近10%。GE搭建的脑卒卒中信息管理理系统可以与与医院Lis和His系统全面对对接,记录患患者的基本信信息、初筛信信息、复筛信信息、用药信信息、实验室室检查、体格格检查信息及及其随访信息息等,全面跟跟踪患者的诊诊治流程。还还可以与PACS系统对接,全全面记录患者者的影像学信信息,实现患患者影像信息息的共享。同同
11、时,可对患患者全流程疾疾病影像信息息回顾,减少少患者重复检检查的负担,协协助医生对患患者疾病信息息的全面判断断。在上述这些大背背景下,本公公司提出并计计划研发“医疗大数据据分析应用平平台”(以下简称“本平台”)产品,以以期为我国医医疗卫生实现现数字医疗、智智慧医疗、健健康医疗发挥挥重要作用。从从而达到:服服务模式(以以患者为中心心,形成居民民健康全过程程服务),从从被动到主动动;医疗模式式(以预防为为主,人人享享有基本医疗疗卫生服务,将将医疗卫生工工作重点由后后治前移到预预防保健),从从治病到防病病;诊疗模式式(避免各自自为政,实行行上下联合,专专业分工),从从排斥到联动动;数据模式式(从业务
12、系系统数据向整整体数据转变变,改变过去去的数据不统统一、不互通通、不共享),从从隔离到整体体;技术模式式(采用各种种新技术手段段,包括大数数据、云计算算、物联网、移移动互联等,形形成技术合力力),从简单单到综合的转转变。2. 产品愿景形成充分发挥大大数据技术的的,针对医疗疗医药行业的的,能充分适适应医疗卫生生信息特征的的大数据分析析应用支撑平平台,通过大大数据分析,达达到发现知识识、发现规律律、预测未来来,将医疗卫卫生行业推进进进入大数据据时代提供技技术可行性。3. 产品定位本平台以医疗卫卫生行业的整整体数据架构构(数据模型型、数据构成成、数据关系系)为基础和和标准,以对对应的医疗卫卫生业务数
13、据据为输入,通通过大数据技技术,形成针针对医疗卫生生行业中不同同机构、角色色和业务活动动的智能化应应用,因此本本平台不是代代替已有医疗疗卫生信息化化系统,而是是在多个方面面强化已有医医疗卫生信息息化系统,包包括任意查询询、即兴分析析、业务增强强、规则约束束、预测未来来、发现知识识,并提供互互动性、及时时性、预知性性、洞察性,从从而达到实现现智慧医疗的的目标。3.1解决的问问题当前医疗卫生信信息化建设的的主要问题是是各个区域内内不同医疗机机构中患者的的基础信息和和各种临床信信息资源分散散、重复、孤孤立,导致有有效信息闲置置、信息重复复或不一致,很很难得到有效效利用。通过本平台实现现国家医疗卫卫生
14、信息化规规划中“4631-2”的三大基础础数据库,即即电子健康档档案数据库、电子子病历数据库库和全员人口口个案数据库库的应用落地地;通过本平台实现现智慧医疗的的核心部分,即即医疗卫生服服务体系的智智能化,使医医疗卫生的各各种应用提升升水平;通过本平台为“看病难、看看病贵”的解决提供供科学定量判判断依据、对对比分析依据据和方案效果果评价依据;3.2达到的效效果本平台预期部署署到云平台上上运行,采用用SOA的理念进行行架构开发,通通过分层将公公共大数据算算法模型封装装为服务,对对业务应用提提供服务,同同时平台业务务应用也是服服务的形式存存在,即应用用单位不再需需要购买部署署自己的服务务器硬软件环环
15、境,只需要要开通相应服服务就可以了了。各个应用用单位根据自自己的业务需需要定制服务务,平台支持持“开通即用”服务模式,为为实现业务应应用集成,本本平台将对外外支持Web SServicce方式的接口口服务。本平台希望将医医疗卫生的智智慧功能应用用普及到业务务角色和过程程的方方面面面,包括医生生(包括专科科医生、全科科医生、保健健医生等)、患患者(包括慢慢性病患者、潜潜在患者等)、管管理者(包括括医疗管理者者、医疗保险险管理者、医医药监管管理理者、公共卫卫生管理者等等)、医药经经营者(药品品研发、药品品生产、药品品物流、药品品零售等)以以及商业医疗疗保险经营者者(健康险、大大病险、医疗疗意外险等
16、)。4. 产品理念医疗卫生、健康康保健、医药药器械形成的的海量数据就就象一座待开开发的金矿,利利用大数据技技术、云计算算技术、物联联网技术和便便携设备技术术的最新成果果,将给医疗疗卫生事业带带来全新革命命性的改变,明明显解决看病病难和看病贵贵的问题,达达到医疗卫生生资源配置分分布合理、大大病小病治疗疗各司其职、疾疾病预防治疗疗有机结合、公公民健康保健健全过程覆盖盖。5. 总体思路通过建立医疗卫卫生大数据的的统一标准和和规范,形成成可被相关业业务应用所利利用的医疗卫卫生大数据源源和交互机制制,在此基础础上,首先形形成专题大数数据应用,这这些应用具有有跨部门和组组织机构的通通用性,并具具有良好的稳
17、稳定性,因为为这些应用是是面向医疗卫卫生专题的;基于专题大大数据应用,根根据医疗卫生生相关部门和和组织机构的的业务要求,可可开发形成各各种业务大数数据应用,并并且随着平台台的推广,积积累的医疗卫卫生业务大数数据应用的实实例将会越来来越多,并最最终形成不同同方向的最佳佳应用样例。5.1对接数据据源,获取医医疗卫生大数数据医疗卫生大数据据中心为本平平台进行医疗疗卫生大数据据分析提供数数据源,但不不在本平台范范围内,并平平台只是开发发提供一套与与该数据中心心的数据读取取接口,并具具有监控数据据读取情况汇汇总统计和异异常提示功能能。该数据中心的定定位:整合区区域内不同医医疗机构中患患者/健康人群的的各
18、种临床诊诊疗数据、健健康数据,在在相对集中的的逻辑/物理环境中中,构建一个个以存储和处处理患者/健康人群诊诊疗信息为核核心,覆盖多多学科、多专专业的面向区区域内主要卫卫生行政主管管部门、临床床医疗机构和和社会公众的的医学(医药药、医疗、健健康)信息资资源共享机制制-区域性医学学数据中心。区区域性医学数数据中心的建建设以行政业业务处理、医医疗、预防、保保健、康复为为服务主线,以以健康人群和和患者的医疗疗活动需求为为基础。区域域卫生数据中中心通过制定定标准的数据据接口,建立立基于广域网网的信息交换换、数据采集集和传输机制制,对区域内内医疗卫生信信息数据进行行采集、传输输、清洗和汇汇总,将医院院、社
19、区、医医药企业以及及公共卫生机机构的各类数数据、系统有有机地整合起起来,生成区区域的卫生大大数据。5.2对获取的的医疗卫生大大数据预处理理机制医疗卫生大数据据预处理主要要完成对已接接收数据的辨辨析、抽取、清清洗等操作,目目的是将数据据按统一的格格式提取出来来,然后再转转化,集成,载载入数据仓库库的工具 (ETL) 包括:抽取取:因获取的的数据可能具具有多种结构构和类型,数数据抽取过程程可以帮助我我们将这些复复杂的数据转转化为单一的的或者便于处处理的构型,以以达到快速分分析处理的目目的;清洗:对于大数据据,并不全是是有价值的,有有些数据并不不是我们所关关心的内容,而而另一些数据据则是完全错错误的
20、干扰项项。 因此要对数数据通过过滤滤“去噪”从而提取出出有效数据。5.3建立医疗疗卫生大数据据的存储机制制虽然关系型数据据库系统(RDBMMS)在安装和使使用上仍然占占有主要地位位,但毋庸置置疑,非关系系型数据库NoSQL技术已经成成为今天发展展最快的数据据库技术。NoSQL是对数据库库系统的总称称,在某种程程度上,它的的性能和用途途可能完全不不同。目前除了关系型型数据库外,还还主要存在有有以下四种NoSQL数据管理系系统:键值数据库:当当数据以键的的形式访问时时,比如通过过国际标准书书号ISBN找一本书,键键值数据库是是最理想的。在在这里,ISBN是键,书籍籍的其他信息息就是值。必必须知道键
21、才才能查询,不不过值是一堆堆无意义的数数据,读取之之后必须经过过翻译。文档数据库:该该数据库以文文档的形式管管理和存储数数据。有点类类似于键值数数据库,但文文档数据库中中的数据有结结构。与键值值数据库中值值是一堆无意意义的数据不不同,文档数数据库中数据据以文档的结结构被描述,典典型的是JavaSScriptt Objeect Nootatioon (JSSON)或XML。文档存储储数据库中的的数据可以通通过定义的任任何模式进行行查询,但键键值数据库只只能通过它的的键进行查询询。列式数据库:也也被称为列式式存储或宽列列存储,一改改之前行式存存储的方式,对对数据进行列列式存储。在在传统关系型型数据
22、库中,数数据经常以行行来访问。以以列式管理记记录的NoSQL数据库可以以管理大规模模的动态列。因因为没有固定定的模式,所所以列名和键键可以变换。列列式数据库适适用于不经常常写的情况,要要满足ACID(原子性、一一致性、隔离离性和持久性性)的要求并并不难,而且且模式是变化化的。图型数据库:图图型数据库关关注值与值之之间的关系,用用图型的数学学概念存储数数据。图型数数据库用带有有点、边缘和和属性的图的的结构表示和和存储数据。在在图型数据库库中,每一个个元素都包含含一个直接的的指向它毗邻邻元素的点,所所以也就不需需要索引查找找。每个种类的NooSQL数据库都有有适用的不同同类型的应用用程序和用例例,
23、这就涉及及到一个NoSQL社区常用的的一个话题,即即多样持久性性,或者说根根据数据库处处理应用程序序需求的不同同,使用不同同的数据库系系统,用于不不同的应用程程序和用例。5.4医疗卫生生大数据的处处理和分析算算法分类和形形成l 技术分类方法 根据挖掘任务:分为分类或或预测模型发发现、数据总总结、聚类、关关联规则发现现、序列模式式发现、依赖赖关系或依赖赖模型发现、异异常和趋势发发现等等; 根据挖掘对象:可分为关系系数据库、面面向对象数据据库、空间数数据库、时态态数据库、文文本数据源、多多媒体数据库库、异质数据据库、遗产数数据库以及环环球网Web; 根据挖掘方法:可分为:机器学习方方法、统计方方法
24、、神经网网络方法和数数据库方法。l 主要处理和分析析技术 预言处理:用历历史预测未来来; 挖掘规律处理:了解数据中中潜在的规律律; 关联分析:查找找存在于项目目集合或对象象集合之间的的频繁模式、关关联、相关性性、或因果结结构; 序列模式处理:给定一个由由不同序列组组成的集合,其其中,每个序序列由不同的的元素按顺序序有序排列,每每个元素由不不同项目组成成,同时给定定一个用户指指定的最小支支持度阈值,序序列模式挖掘掘就是找出所所有的频繁子子序列,即该该子序列在序序列集中的出出现频率不低低于用户指定定的最小支持持度阈值; 分类(预言)分分析:预测分分类标号(或或离散值),根根据训练数据据集和类标号号
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医疗 数据 分析 应用 平台 DOC84 50043
限制150内