基于数据挖掘方法寿险业务管理KPI指标分析.pdf
《基于数据挖掘方法寿险业务管理KPI指标分析.pdf》由会员分享,可在线阅读,更多相关《基于数据挖掘方法寿险业务管理KPI指标分析.pdf(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、武汉科技大学硕士学位论文基于数据挖掘方法寿险业务管理KPI指标分析姓名:黄慧超申请学位级别:硕士专业:计算机应用技术指导教师:张晓龙20090420武汉科技大学硕士学位论文第1 页摘要为了提高人寿保险行业工作效率和服务水平,建立高效的管理机制,适应业务的开展和激烈的市场竞争,商业智能开始进入寿险行业,K P I 指标分析系统应运而生。本文基于数据仓库、联机分析处理及数据挖掘等技术理论,研究了K P I 指标分析系统构建与实现。本文首先介绍了课题研究背景,指出客户工作中面对的有关数据的难题,描述了K P I指标分析系统的优越性;简要概述了数据仓库、联机分析处理及数据挖掘技术特点,深刻分析了三者之
2、间内在的联系性:给出了数据仓库的设计步骤,分析了数据仓库的体系结构,讨论了联机分析处理及多维分析中的上钻和下钻等操作,描述了数据挖掘过程,给出常用数据挖掘算法和比较分析。本文描述了K P I 数据指标决策系统的建设背景和K P I 指标形成。参照C R I S P D M 重点讨论了数据抽取、转换、加载技术整个E T L 的实现过程;其中以K P I 中“保费契撤率一指标为例,给出了数据仓库模型设计中相应事实表和维表的创建和相应S Q L 存储过程。本文描述了面向主题的分析模型在K P I 指标分析系统的展现;提出了基于数据仓库,综合应用联机分析处理和数据挖掘技术的K P I 指标分析系统的总
3、体设计方案;本文理论上提出多维复杂查询分析优化思想,为K P I 指标分析系统在人寿保险领域的应用做出了有价值的探索。关键词:数据挖掘;数据仓库;联机分析处理;关键业绩指标;商业智能第1 I 页武汉科技大学硕士学位论文A b s t r a c tF o ral i f ei n s u r a n c ei n d u s t r yt oi m p r o v ee f f i c i e n c ya n ds e r v i c el e v e l,i tn e e d st os e tu pe f f i c i e n tm a n a g e m e n tm e c h a
4、 n i s m,a d a p t e dt oc a r r yo u to p e r a t i o n sa n dt h ef i e r c em a r k e tc o m p e t i t i o n B u s i n e s si n t e l l i g e n c eb e g i n st oe n t e rt h el i f ei n s u r a n c ei n d u s t r y,K P I sa n a l y s i si su s e d B a s e do nt h ed a t aw a r e h o u s e O n-L i
5、 n eA n a l y t i c a lP r o c e s sa n dD a t aM i n i n g,t h i st h e s i sd e s c r i b e st h eK P IA n a l y s i sS y s t e mC o n s t r u c t i o na n di m p l e m e n t a t i o n T h et h e s i si n t r o d u c e s t h er e s e a r c hb a c k g r o u n d,d e s c r i b e st h et a r g e tK P
6、Ia n a l y s i so ft h es u p e r i o r i t yo ft h es y s t e m,t h eo v e r v i e wo fd a t aw a r e h o u s i n g,o n l i n ea n a l y t i c a lp r o c e s s i n ga n dd a t am i n i n gf e a t u r e s,a n dad e e pa n a l y s i so ft h et h r e ec o n t a c to ft h ei n t r i n s i cn a t u r e
7、I ta l s og i v e st h es t e p so fd a t aw a r e h o u s ed e s i g n,a n a l y s i so ft h ed a t aw a r e h o u s ea r c h i t e c t u r e,d i s c u s s e st h em u l t i d i m e n s i o n a lo n l i n ea n a l y t i c a lp r o c e s s i n ga n da n a l y s i so fd r i l l i n ga n dd r i l l i
8、n go p e r a t i o n s,d e s c r i b e st h ep r o c e s so fd a t am i n i n ga n dc o m m o n l yu s e dd a t am i l l i n ga l g o r i t h ma n dc o m p a r a t i v ea n a l y s i s T h eK P I ss y s t e mi nt h et h e s i sd e s c r i b e st h ed a t ac o n s t r u c t i o no ft h ec o n t e x t
9、o fd e c i s i o n m a k i n gs y s t e ma n dt h ef o r m a t i o no fK P It a r g e t C R I S P-D Mr e f e r e n c ef o c u s e so nd a t ae x t r a c t i o n,t r a n s f o r m a t i o n,l o a d i n gt h et e c h n i c a li m p l e m e n t a t i o no ft h ee n t i r eE T Lp r o c e s s,T a k i n g
10、”L e a s ep r e m i u m sw i t h d r a w a lr a t e 勰a ne x a m p l et a r g e t,t h i st h e s i sd e s c r i b e st h ed e s i g no fd a t aw a r e h o u s em o d e l,a n di n t r o d u c e st h ec r e a t i o na n dc o r r e s p o n d i n gS Q Ls t o r e dp m c e d u r ef o rf a c ta n dd i m e n
11、 s i o nt a b l e W ed e s c r i b et h ea n a l y s i so fs u b j e c t-o r i e n t e dm o d e lo ft a r g e tK P I sA n a l y s i sS y s t e ma tt h es h o w B a s e do nd a t aw a r e h o u s e,o n l i n ea n a l y t i c a lp r o c e s s i n gi n t e g r a t e sa p p l i c a t i o na n dd a t am
12、i n i n gt e c h n o l o g i e st a r g e tK P I sa n a l y s i ss y s t e md e s i g np r o g r a m I nt h e o r y,w ep u tf o r w a r dm u l t i d i m e n s i o n a la n a l y s i so fc o m p l e xq u e r yt h o u g h tO p t i m i z ef o rt a r g e tK P I sa n a l y s i ss y s t e ma tt h ef i e l
13、 do fl i f ei n s u r a n c ea p p l i c a t i o nm a d et oe x p l o r ep o t e n t i a l K e yw o r d s:D a t aM i n i n g;D a t aW a r e h o u s e;O nL i n eA n a l y t i c a lP r o c e s s;K e yP e r f o r m a n c eI n d i c a t i o n;B u s i n e s sI n t e l l i g e n c e武汉科技大学研究生学位论文创新性声明本人郑重声
14、明:所呈交的学位论文是本人在导师指导下,独立进行研究所取得的成果。除了文中已经注明引用的内容或属合作研究共同完成的工作外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:黄趣日期:兰1 7:!:?7研究生学位论文版权使用授权声明本论文的研究成果归武汉科技大学所有,其研究内容不得以其它单位的名义发表。本人完全了解武汉科技大学有关保留、使用学位论文的规定,同意学校保留并向有关部门(按照武汉科技大学关于研究生学位论文收录工作的规定执行)送交论文的复印件和电子版
15、本,允许论文被查阅和借阅,同意学校将本论文的全部或部分内容编入学校认可的国家相关数据库进行检索和对外服务。论文作者签名:指导教师签名:日期:煎茎塑越缝垄圣:望:翌武汉科技大学硕士学位论文第l 页1 1 本课题的研究背景和意义第一章绪论寿险是保险行业的一个重要分支,具有巨大的市场发展空间,因此,随着寿险市场的开放、外资公司的介入,竞争逐步升级,群雄逐鹿已成定局如何保持自身的核心竞争力,使自己始终立于不败之地,是每个企业必须面对的问题。信息技术的应用无疑是提高企业竞争力的有效手段之一寿险信息系统经过了多年的发展,已逐步成熟完善,并积累了相当数量的数据资源,为数据挖掘提供了坚实的基础,而通过数据挖掘
16、发现知识,并用于科学决策越来越普遍受到寿险公司的重视。本文涉及的是国内一家知名人寿保险公司。其各部门主管在业务发展中面对日益增多的数据管理上显得效率不足:大量积累的业务数据本应是通过分析为公司提供决策依据,但由于缺乏有效的分析手段,主管们很难从这些数据中获得价值,也无法从中提取对部门管理更行之有效的关键业绩指标,以考核业务部门的管理和提高业务部门的管理水平。数据仓库和数据挖掘在解决企业面临诸如:风险、增值和绩效等问题时提供了很好的解决方案。例如:超市中进销存系统的应用,银行业中的客户数据挖掘,项目实施风险中的应用和电信增值服务中的应用等等。而本文主要描述数据仓库和数据挖掘在人寿保险领域中的研究
17、和应用。每当要对寿险中大量历史的业务数据或是某一特定时间间隔的数据进行处理以获取有用的信息时,这时就必须实施数据整理,利用数据仓库技术,建立起全新的数据挖掘、知识发现体系,获得有价值的和较直观的信息用于分析决策参考和辅助管理。关键业绩指标(K P I),是通过对部门内部某流程绩效衡量的一种目标式量化管理指标,是把企业的战略目标分解为可运作的远景目标的工具,是企业绩效管理的基础。本文针对寿险行业业务管理的K P I 指标分析进行了数据挖掘,其挖掘过程与其他行业应用相似之处在于:都是先通过需求分析对客户原有数据进行质量控制,以此为基础进行数据仓库设计,再采用数据分析方法来提取对客户有价值的信息。从
18、寿险业务需求角度出发,通过对寿险公司各部门数据库数据的研究,形成了基于数据仓库的寿险多元行销部门整体架构,得到了系统主要的主题分析,完成了基于主题分析的数据仓库建模;并将判定树归纳、多维O L A P 概念分层应用到K P I 指标分析挖掘过程中;利用“可视化查询器”将客户所需的K P I指标分析以3 一D 直方图、报表、曲线图和仪表盘图等多种形式呈现给客户,最终完成对K 1 I决策分析的挖掘工作。为客户信息化业务管理提供了很好的决策支持。1 2 数据库与数据仓库数据库与数据仓库都是用来储存数据的,那么数据存储的最终目的是什么呢?首先,它一定是数据。这类信息在海量数据库中都是支离破碎的,对于企
19、业一般人员来说并不是一个很有意义的东西。那么,我们存储数据的最终目的应该是把数据转化为信息,信息对企业执行者、运营者包括商务人员和市场人员有很重要的作用。进而企业运营者把他们的一些业务经验、行业背景知识与这些信息结合起来,就可以变成知识。所以,对一个企业第2 页武汉科技大学硕士学位论文来说,这就是把一些死的数据转化为信息和知识,即知识发现(K D D,k n o w l e d g ed i s c o v e r yi nd a t a b a s e s)。变成知识后,我们才能够为企业下一步决策做出引导,才能对企业真正带来价值。那么数据库和数据仓库都是用来存放数据的,它们之间究竟有什么不同
20、呢?首先从定义的角度出发,来看看它们之间的区别。数据库是指长期储存在计算机内的、有组织的、可共享的数据集合【I】。在这个集合中可以按照信息的逻辑结构对其进行组织与存取。数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合【2】。数据仓库,是在已有数据库的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库。数据仓库与传统数据库区别在于:面向主题的:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。与时间相关:数据库保存信息的时候,并不强调一定有时间信息。数据仓库则不同,出于决策的需要,数据仓库中的数
21、据都要标明时间属性。不可修改:数据仓库中的数据并不是最新的,而是来源于其它数据源。数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据。1 3 数据仓库1 3 1 商业智能与数据仓库商业智能(B I,B u s i n e s sI n t e l l i g e n c e)通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。B I 目的就是怎么把数据变成目标和知识。因此,从技术角度上来讲,B I 不是什么新的技术,它只是数据仓库、O L A P 和数据挖掘等技术的综合应用。近些年来,整个商业智能体系结构已经有了相当的发展,从简单的商业报表输出和主管信
22、息系统(E I S,E x e c u t i v eI n f o r m a t i o nS y s t e m),到多维分析统计和数据挖掘,再到可定制的分析应用技术的引进,所有这些技术都促使了B I 环境的构建日趋成熟。商业智能决策支持系统【3】【4】就是最好的例证,它以数据仓库技术为基础,对大量的市场营销数据进行处理,再按照一定的业务逻辑进行重新组织和分析,通过灵活的前端展现。实时商业智能【5 1(R T B I,R e a l T i m eB u s i n e s sI n t e l l i g e n c e)及其在运营风险管理上的应用【6】就是商业智能系统发展的最新体现。
23、数据仓库是分布式数据源的存储体系结构。其特点是主要处理趋于静态的数据,是一个典型的主体数据库。它使用深入企业数据库当中跟踪操作数据,以得到业务趋势,最终完成预测和计划。数据集市是一种便捷的数据源子集的存储方式,通常来自数据仓库。它是从数据仓库抽耿的一个特定的主题。数据仓库在设计中的两个思想武汉科技大学硕士学位论文第3 页第一,它必须有一个合适的粒度或细节级别以满足所有的数据集市,即:它必须包括具有最少公共点的细节数据,以便提供聚集的、汇总的集市,以及提供用于事务级别的探索和挖掘的仓库;第二,该设计必须适应多维集市、统计、挖掘以及探索型仓库,还必须适应分析型应用,以支持任何新的尖端技术。它必须支
24、持的模式包括:星型模式、平面文件、规范化数据的统计型子集以及B I 将来需要的模式。1 3 2 数据仓库正在成为主流最初,有四个主要的因素促使越来越多的公司使用数据仓库:激烈的竞争环境、政府缩小管制、重构内部流程的需要和急需为用户定制的市场销售策略。电信业、金融业和零售业是最早采用数据仓库的行业。零售业采用数据仓库是因为激烈的市场竞争。即将或正在采用数据仓库的行业是金融服务、医疗保健、保险行业和制造业。今天,电信和银行业一如既往地在数据仓库费用上保持着大量的投入,并且分别占到了两个行业预算的1 5 以上。从事这些行业的公司收集了大量的交易数据。由此采用数据仓库有利于将这些数据转化成为公司决策的
25、战略信息。现在市场上数据仓库的主流产品有:O r a c l eH y p e r i o nI n t e l l i g e n c e,S P S S&C l e m e n t i n e,S Q LS e r v e r2 0 0 5 2 0 0 8B u s i n e s sI n t e l l i g e n c eD e v e l o p m e n tS t u d i o,S A P(S y s t e m sA p p l i c a t i o n,P r o d u c t si nD A T Ap r o c e s s i n g)和M i c r os t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 方法 寿险 业务 管理 KPI 指标 分析
限制150内