小议汽车保险中关联规则挖掘的运用(共2188字).doc





《小议汽车保险中关联规则挖掘的运用(共2188字).doc》由会员分享,可在线阅读,更多相关《小议汽车保险中关联规则挖掘的运用(共2188字).doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、小议汽车保险中关联规则挖掘的运用(共2188字)关联规则挖掘的步骤:(1)找出所有的频繁项集。这些项集出现的频率至少和预定义的最小支持数一样,即所有满足最小支持度的项集的集合。(2)由频繁项集中产生相应的强关联规则。根据定义,这些规则必须满足最小支持度和最小置信度。即确定规则A= B是否有效,可以令:r=sup(AB)/sup(A),当且仅当r min_conf时,规则有意义(其中min_conf为最小置信度)。(3)解释并输出规则步骤一是关联规则发现算法设计的核心问题,因为它的效率高低是算法的关键.由于Apriori关联规则算法3需要产生大量候选项集,资源消耗巨大,效率低。而FP-Growt
2、h关联规则算法只需扫描一次数据库,对系统资源的消耗较小,效率相对较高。因此,对于海量数据的保险信息系统,本文选用FP-Growth算法进行关联规则挖掘.关联规则挖掘在车辆保险中的应用1.数据准备数据准备是数据挖掘过程的先决条件,数据质量将直接影响数据挖掘的效率和准确度以及最终规则的合理有效性。本文选取某大型保险公司省级公司近8年车险数据库数据进行挖掘。影响车辆保险的风险主要有驾驶人员、车辆状况、地理环境、气候条件、社会环境、经营管理等因素,为此研究这些因素与风险的关系,并结合实际情况和对风险的影响程度,从中选取的目标数据每条记录中包括年龄、性别、婚姻状况、驾龄、职业、车重与载货重、车型、车龄、
3、汽车颜色、使用性质、投保险种、保费保额、汽车贷款标志、购买价格、多车所有情况、是否连续投保、投保地点、销售渠道、投保日期、出险日期、赔付率等21个属性进行关联规则的挖掘整理归纳。2.数据离散化和去冗余利用计算机对数据库的海量数据进行分析挖掘,需要对连续的数据作离散化工作。年龄、保额、投保出险日期、赔付率都是连续的数据。为了离散量化,根据情况和计算机编程计算的需要可将这些数据分为几类。例如,年龄分为a1(20岁),a2(20-25岁),a3(25-34岁),a4(3545岁),a5( =46岁),将日期按提取数据年份年分为8年,每年具体日期按月分为12个值。将赔付率划分为00,、(0,10%、(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 小议 汽车保险 关联 规则 挖掘 运用 2188

限制150内