欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    企业竞争的利器数据仓库和数据挖掘.ppt

    • 资源ID:88822928       资源大小:1.55MB        全文页数:59页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    企业竞争的利器数据仓库和数据挖掘.ppt

    企业竞争的利器数据企业竞争的利器数据仓库和数据挖掘仓库和数据挖掘电信企业参与竞争的利器-数据仓库和数据挖掘提要提要市场竞争-竞争技术数据仓库的基本认识数据仓库设计数据挖掘数据融合动力系统研究我们的实践2电信企业参与竞争的利器-数据仓库和数据挖掘市场竞争市场竞争-竞争技术竞争技术随着电信市场的开放,竞争将越来越激烈利润的降低使得必须从粗放的经营转变到集约的经营经营决策需要尽可能多的定量的依据经营决策需要尽可能快的速度所有这些需要技术上的支持-数据仓库和数据挖掘3电信企业参与竞争的利器-数据仓库和数据挖掘数据仓库的基本认识数据仓库的基本认识4电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:什么是数据仓库技术(Data Warehousing)?l是一个处理过程,而不仅仅代表一组产品l是一个从大量的企业数据中发现有价信息的过程l是充分利用现有资源,而不是摒弃重构l是提供系统及数据的多种访问形式电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:什么是数据仓库(Data Warehouse)?数据仓库是在企业管理和决策中面向主题的,集成的,与时间相关的和不可修改的数据集合Bill Inmon电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:数据仓库体系结构图电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:数据仓库应用体系结构数据集成数据集成数据集成数据集成数据转换数据转换数据转换数据转换数据发布数据发布数据发布数据发布Warehouse Process ManagementWarehouse Process Management数据存取数据存取数据存取数据存取MetadataMetadatan数据集成数据集成:集成不同业务系统中的数据集成不同业务系统中的数据n数据转换数据转换:全部数据被转换成统一的数据格式全部数据被转换成统一的数据格式n数据发布数据发布:数据被存储在靠近用户的地方数据被存储在靠近用户的地方n数据存取数据存取:满足数据分析等应用需求满足数据分析等应用需求nMetadata:元数据.即数据仓库的数据字典.nWarehouse Process Management 保证数据仓库的正确实施电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:建设数据仓库的十二步1.定义项目范围,制定项目开发计划2.确定在企业决策中至关重要的数据3.用数据语言描述企业需求4.建立并修正企业的逻辑数据模型5.建立数据仓库数据模型6.定义数据集市数据模型7.定义可操作的数据源(OLTP数据)8.详细设计9.设计数据仓库的物理数据库10.准备高层次的应用结构设计11.定义各种技术规范12.准备项目实施计划电信企业参与竞争的利器-数据仓库和数据挖掘统一认识:数据仓库建设取得成功的关键因素从项目建设的角度出发:有一个坚实的数据仓库数据模型 有一个专职的数据仓库分析小组 有一个经过深思熟虑的执行计划 各方紧密配合 资金保证 好的自动化工具,支持设计过程和元数据管理 最终用户好用 各种工具齐全,易得 正确的期望值 有专家支持从用户的角度出发:数据准确 数据易于管理 数据可以随时刷新 数据容易访问 数据表现通俗易懂 有利于正确的企业决策电信企业参与竞争的利器-数据仓库和数据挖掘数据量估算 一般情况下,数据空间=数据量估算*2索引空间=数据空间*0.5估算数据量时要考虑:现有数据日,月,季和年的增长率.数据仓库中保留多长时间的历史数据:数据仓库中一般保留几年数据.操作型系统中一般只保留当前数据注意:数据仓库系统和OLTP系统不同,它需要更大的临时空间,用于排序操作和数据求和汇总数据仓库系统也需要较大的缓存空间,用于驻留经常被访问的数据.电信企业参与竞争的利器-数据仓库和数据挖掘模型选择:Inmon 的数据分布式体系结构数据源系统ODS:操作型数据存储集中式数据仓库数据集市OLTP系统时实数据实时/准时实数据数据以批方式修改数据日期:1秒-2 天历史数据数据以批方式修改数据日期:1天-5 年历史和汇总数据数据以批方式修改数据日期:1天-10 年n 数据源系统也可以直接给数据仓库和数据集市提供数据 电信企业参与竞争的利器-数据仓库和数据挖掘模型选择:集中式数据仓库模型OLTP数据源系统集中式数据仓库最终用户n数据被不断地从数据源系统累积到数据仓库中n数据格式和数据的取舍规则与OLTP系统独立n数据仓库中存放的是企业的数据,可以跨业务领域nOLTP 系统 与数据仓库系统彼此独立,OLTP的性能不受影响电信企业参与竞争的利器-数据仓库和数据挖掘模型选择:集中分布式数据仓库模型OLTP数据源系统集中式数据仓库按地域发布的数据集市地域性最终用户n 数据更靠近最终用户电信企业参与竞争的利器-数据仓库和数据挖掘模型选择:分布式累积型数据仓库模型按地域发布的数据集市各地区的OLTP数据源系统集中式数据仓库n 集中定义数据的集成与转换规则 n 数据传递从下往上n 此模型适用于敺植际綌企业电信企业参与竞争的利器-数据仓库和数据挖掘硬件与软件选择:硬件选择数据库服务器的选择取决于数据库的大小和查询的复杂度电信企业参与竞争的利器-数据仓库和数据挖掘硬件与软件选择:硬件选择(续)网络服务器:Single CPU Pentium-based serversUp to 10 GB DatabasesSingle processor UNIX platforms10 to 40 GB Databases适用于高度汇总(Highly Summaried)型数据仓库适用于做网关(Gateway)SMP 数据库服务器:2 to 64 CPUs (通常 4 to 8)共享内存/硬盘大容量内存适用于中型和大型数据库SMP 供应商:Digital,HP,Pyramid,Sequent,Sun,Cray,IBM电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据仓库数据的多级模型OlderatomicdataCurrentatomicdataLightlysummarizedHighlysummarizedMETADATA85-90%of analysis10%of analysis电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据仓库数据建模的一般方法1.获取最终用户的业务需求2.定义业务规则3.建立主题(SA)数据视图4.建立企业逻辑数据模型5.定义操作型的数据源6.建立数据仓库数据模型7.必要的话,把数据仓库模型分割成几个子模型,分别建设,以满足不同用户和不同工具的需要.注意注意:数据仓库建设的每一步都要严格质量检查数据仓库建设的每一步都要严格质量检查,每一步的实施每一步的实施可能要经过多次反复可能要经过多次反复.电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据建模的基本概念 模型模型-对主题的抽象表示.数据模型数据模型-对一定范围的数据的定义,特征和关系的表示.主题视图主题视图-高层主题及其关系的表示.逻辑数据模型逻辑数据模型-从最终用户的角度出发,对企业中的信息的数学描述.这里并不考虑数据的功能和物理属性.数据仓库数据模型数据仓库数据模型-是反映在决策支持分析活动中对数据的使用的数据模型 实体实体(Entity)-代表 人,物,地点和事件.实体在数据模型中是唯一的.关系关系(Relationship)-两个实体之间的企业规则.元素元素(Element)-表现实体的低级属性.也称为属性(Attribute)键键(Key)-唯一识别一个实体的元素.属性属性(Attribute)-实体中的非键元素.递归递归(Recursion)-与自身相关的实体关系.电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:主题视图模型,逻辑数据模型与数据仓库数据模型之间的关系主题视图主题视图逻辑数据模型逻辑数据模型操作型数据模型操作型数据模型数据仓库数据仓库数据模型数据模型物理模型物理模型数据集市数据集市数据模型数据模型电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:什么是主题?主题代表企业中数据的自然归类范畴主题代表企业中数据的自然归类范畴.主题也称为高层实体主题也称为高层实体.主题视图包含主题视图包含:数据被归类成为广义的,功能上独立的,没有重叠的主题.表现数据之间的主要关系.表现模型之间的数据共性.主题视图中的主题数目一般不超过 12 个 可以先构造局部主题视图,然后合并成全局主题视图.电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:局部主题视图CustomerOrderProductOrderPartProductCustomerOrderEmployeesPartSupplierUser View 1User View 2User View 3User View 4电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:全局主题视图CustomerOrderEmployeesPartProductSupplier电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:建立逻辑数据模型的基本方法l基于主题视图基于主题视图,把主题视图中的数据定义转入到逻辑把主题视图中的数据定义转入到逻辑数据模型中数据模型中.l删除重复数据项删除重复数据项l识别某些数据共性识别某些数据共性,比如比如:数据类型数据类型,.l识别主题间的关系识别主题间的关系l分解多对多的关系分解多对多的关系l用范式理论检验逻辑数据模型用范式理论检验逻辑数据模型l由用户审核逻辑数据模型由用户审核逻辑数据模型l命名规则审核命名规则审核电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:主题视图与逻辑数据模型ProductOrderHigh-level主题视图主题视图Mid-level逻辑数据模型逻辑数据模型Customer IDCustomer NameCredit RatingCustomer IDCustomer Address TypeAddress Line 1Address CityAddress StateAddress Zip-codeOrderCustomer IDSIC CodeNo.EmployeesCommercialCustomer IDNo.KidsIncome LevelResidentialCustomerCustomerSelectedSubject Area电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:逻辑数据模型与数据仓库数据模型的区别逻辑数据模型逻辑数据模型 数据仓库数据模型数据仓库数据模型范式化范式化 非范式化非范式化详细数据详细数据详细和汇总数据详细和汇总数据企业运作角度企业运作角度 企业决策和战略角度企业决策和战略角度可能含有时间键可能含有时间键 必须含有时间属性必须含有时间属性没有派生数据没有派生数据 含有派生的战略数据含有派生的战略数据无数据数组无数据数组 有数据数组有数据数组以企业规则为中心以企业规则为中心 以数据的使用和稳定性为中心以数据的使用和稳定性为中心 电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据粒度分析数据粒度数据粒度(Data Granularity)-代表数据的细节化程度.粒度越大,数据的汇总程度越高.事务级数据的粒度最小,它是汇总型数据的数据源.数据仓库中数据的粒度取决于数据仓库的类型.数据仓库中数据的粒度可以和操作型系统的数据粒度一样,也可以不一样.当粒度发生改变时,数据仓库数据模型要反映出这种变化.如果仅仅存储汇总型数据,那么数据的细节型分析就无法做到电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据粒度分析在数据仓库中,多层(Multi-tier)体系结构表达的是数据的汇总程度.每一层并不一定彼此独立并非每个数据仓库项目都含有多层汇总.电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据汇总模型 简单累加简单累加:如如,求和每天各种商品的销售额求和每天各种商品的销售额 滚动型累计滚动型累计:如如,求和每周各种商品的销售额求和每周各种商品的销售额 清单型汇总清单型汇总:类似于做台账类似于做台账 连续汇总连续汇总:形如多级汇总形如多级汇总 纵向汇总纵向汇总:按特定的问题进行汇总按特定的问题进行汇总,以获取最佳的性能以获取最佳的性能.电信企业参与竞争的利器-数据仓库和数据挖掘设计阶段:数据稳定性分析数据仓库中数据的最好组织原则是数据仓库中数据的最好组织原则是:变化慢的数据存放在一张表中.变化快的数据存放在另一张表中.关键是要根据数据的稳定性关键是要根据数据的稳定性,对数据元数进行分离对数据元数进行分离下列数据应该按其稳定性来组织下列数据应该按其稳定性来组织:数据的修改时间完全不同.最终用户习惯于频繁地修改数据.下列数据可以不按其稳定性来组织下列数据可以不按其稳定性来组织:系统性能不好.大部分时间总是被一起使用.电信企业参与竞争的利器-数据仓库和数据挖掘数据集市数据模型设计数据集市是数据仓库中数据的一个子集数据集市是数据仓库中数据的一个子集,用于解决某个用于解决某个业务部门特定的应用需求业务部门特定的应用需求.电信企业参与竞争的利器-数据仓库和数据挖掘数据集市数据模型设计数据集市数据集市:从数据仓库中派生出来可以和数据仓库存放在同一平台上,也可以分开.应该把它作为数据仓库的一部分 来建设ArchiveddetailEnterprise-wideIndividualMETADATAData MartIndividualData Mart电信企业参与竞争的利器-数据仓库和数据挖掘多维模型n多维模型是人们观察数据多维模型是人们观察数据的形象表示 n可以是可以是 2,3,4或更多维或更多维 n可以对多维模型进分析可以对多维模型进分析-即:选择哪维作为查询条件.Product LinesRegionsTimen传统的数据模型比较复杂传统的数据模型比较复杂,最终用户难于理解最终用户难于理解n多表联结多表联结(Join)查询查询(尤其是大表尤其是大表),既费时既费时,又占用大量资源电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:基本概念8维:是人们观察数据的特定角度8维成员:维的取值.8维层次:代表维的细节程度.比如:时间维的层次可以是年,季,月,周,日,等等.8类:维成员互不相交的一个子集.8多维分析:指对以维形式组织的数据采取切片,切块和旋转等动作,以求全面深刻地分析数据.8切片(Slice):按照某一维取值做查询.8切块(Dice):按照一维或多维取值做查询.8旋转:改变一个报告或页面显示的维方向.8维表:存放维数据.8事实表:由事实数据元素和维数据元素组成.事实表是多维多维模型的核心.事实数据是决策分析的数据基础.电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:怎样建立维表和事实表建立维表和事实表要考虑建立维表和事实表要考虑:建立中央事实表,它存储大量数据.事实表周围,维表的数目要少,并且维表中的数据量要小.关键是要控制维数,它直接影响数据粒度.注意注意1:多维模型是非范式化的多维模型是非范式化的,大量的事实数据可能是重复的大量的事实数据可能是重复的.2:多维模型通常不适合企业级的模型分析多维模型通常不适合企业级的模型分析,因为在企业级因为在企业级,数据量太大并且太复杂数据量太大并且太复杂.电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:多维数据模型的四种模式l星型模式(Star Schema)l雪花模式(Snowflake Schema)l星座模式(Constellation Schema)l雪暴模式(Snowstorm Schema)电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:星型模式Grocery TransactionStore NumberTransaction DateCustomerProductQuantityAmountCustomerCustomerFrom DateTo DateFirst NameLast NameAddress 1Address 2Address 3CityStateCountryPostal CodeTimeTransaction DateStoreStore NumberStore NameCityStateCountryTelephoneProductProductDescriptionCategoryFact TableDimensionTablesDimensionTables电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:雪花模式Grocery TransactionStore NumberTransaction DateCustomerProductQuantityAmountCustomerCustomerFirst NameLast NameAddress 1Address 2Address 3CityStateCountryPostal CodeCustomer CategoryTimeTransaction DateStoreStore NumberStore NameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProduct CategoryProduct CategoryDescriptionRegionRegionDescriptionSales PeriodPeriod IdentifierSales PeriodFrom DateTo DateCustomer CategoryCategoryCustomer Categoryn为了避免数据冗余为了避免数据冗余,用多张表来描述一个复杂维用多张表来描述一个复杂维n在星型模式的基础上在星型模式的基础上,构造维表的多层结构构造维表的多层结构电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:星座模式Grocery TransactionStore NumberTransaction DateCustomerProductPurchase QuantityAmountCustomerCustomerFirst NameLast NameAddress 1Address 2Address 3CityStateCountryPostal CodeCustomer CategoryTimeTransaction DateStoreStore NumberStore NameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProduct LineSales PeriodPeriod IdentifierSales PeriodFrom DateTo DateCustomer CategoryCategoryCustomer CategoryProduct PurchasesProductPurchase DateSupplying VendorPurchase OrderUnit QuantityPurchase CostVendorVendorVendor NameAddress 1Address 2Address 3CityStateCountryPostal CodeProduct InventoryProductWarehouse LocationQuantity On HandQuantity Back OrderedWarehouseWarehouseAddress 1Address 2Address 3CityStateCountryPostal Coden具有多个事实表具有多个事实表电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:雪暴模式Grocery TransactionStore NumberTransaction DateCustomerProductPurchase QuantityAmountCustomerCustomerFirst NameLast NameAddress 1Address 2Address 3CityStateCountryPostal CodeCustomer CategoryTimeTransaction DateStoreStore NumberStore NameCityStateCountryTelephoneRegionProductProductDescriptionCategoryProduct LineProduct CategoryProduct CategoryDescriptionRegionRegionDescriptionSales PeriodPeriod IdentifierSales PeriodFrom DateTo DateCustomer CategoryCategoryCustomer CategoryPromotion PeriodPromotion IdPromotionFrom DateTo DateProduct LineProduct Line IDDescriptionProduct PurchasesProductPurchase DateSupplying VendorPurchase OrderUnit QuantityPurchase CostVendorVendorVendor NameAddress 1Address 2Address 3CityStateCountryPostal CodeProduct InventoryProductWarehouse LocationQuantity On HandQuantity Back OrderedWarehouseWarehouseAddress 1Address 2Address 3CityStateCountryPostal Coden具有多个事实表与多层维表具有多个事实表与多层维表电信企业参与竞争的利器-数据仓库和数据挖掘多维模型:如何增加时间维?Grocery TransactionStore NumberTransaction DateCustomerProductQuantityAmountTimeTransaction DateSales PeriodPeriod IdentifierSales PeriodFrom DateTo Daten取决于企业结构与时间的使取决于企业结构与时间的使用方式p确定企业的时间坐标,是一个坐标,还是有几个坐标?p企业是否有财政年和日历年?p弄清哪些数据属于哪个时间坐标p企业的成员与相关者是否有相同的节假日?电信企业参与竞争的利器-数据仓库和数据挖掘面向个人的数据仓库数据模型设计集中的数据仓库数据集市个人数据集市与个人相关的,或个人感兴趣的1天-10年的数据.可以是高度汇总型数据,或个人特定的数据历史数据数据以批方式修改数据日期:1天-5 年历史和汇总数据数据以批方式修改数据日期:1天-10 年电信企业参与竞争的利器-数据仓库和数据挖掘操作型数据存储(ODS)与数据仓库ODS集成企业中所有的操作型系统中的数据集成企业中所有的操作型系统中的数据,用以支持用以支持企业日常的全局应用企业日常的全局应用操作型数据存储操作型数据存储(ODS)与数据仓库之间与数据仓库之间有着非常明确的区别有着非常明确的区别.电信企业参与竞争的利器-数据仓库和数据挖掘操作型数据存储(ODS)与数据仓库的区别-适用于当前的,偏细节性的决策-面向战术型用户-适用于长期的,方向与定位性的决策-面向战略型用户OperationalData StoreDataWarehouse-面向主题的面向主题的-集成的集成的-易变的易变的-当前的当前的,或最近的数据或最近的数据-主题独立的主题独立的-集成的集成的-不变的不变的-历史与汇总数据历史与汇总数据电信企业参与竞争的利器-数据仓库和数据挖掘操作型数据存储(ODS),数据仓库和数据集市的关系SourceSystemsOperationalData StoreCentral DataRepositoryMetadataEISDSSPCDataMartn ODS可以实现数据的集成与数据清洗电信企业参与竞争的利器-数据仓库和数据挖掘什么是元数据(Metadata)是描述数据仓库中数据的数据 Metadata 的组成是:表,数据元素,主键数据元素的物理特征各种定义数据抽取历史数据汇总算法数据属主关系及存取模式数据生命期以及淘汰规则数据安全性数据的度量单位电信企业参与竞争的利器-数据仓库和数据挖掘怎样收集元数据?在整个数据仓库建设过程中,元数据被不断积累和丰富,从源数据到目标数据或相反是可以追踪的电信企业参与竞争的利器-数据仓库和数据挖掘数据转移与加载:基本模型Bulk Data TransferPeriodic Periodic Data RefreshData RefreshData SourcesData TargetsStore and ForwardD DA AT TA AD DA AT TA AD DA AT TA AD DA AT TA ADRDRDMDMPersonalPersonalDMDMODSODSDRDRODSODSDRDRDMDMReal-Time Synchronous2PC2PC2PC2PC2PC2PC电信企业参与竞争的利器-数据仓库和数据挖掘数据仓库应用阶段:数据访问方式简单的访问形式有:动态SQL命令 使用图象工具标准报表应用工具电子报表常用的应用类型:DSS软件(Decision support systems):生成各种日常报告EIS软件(Executive information systems):详细分析数据模型,走势,异常和汇总报表软件:产生标准报表.电信企业参与竞争的利器-数据仓库和数据挖掘数据分析的四种模型与相应工具数据分析的四种模型:h绝对模型属于静态数据分析.它通过比较历史数据和行为来描述过去发生的事情.h解释模型属于静态数据分析.它通过层层细化,找出事实发生的原因.h思考模型属于动态数据分析.它通过引入一定参数后,预测将来会发生什么.h公式模型最高级动态数据分析.它知道需要引入哪些参数以及所产生的结果.数据分析的工具有三种类型:h查询工具:指对分析结果的查询,而不是记录级的查询.h验证型工具:从数据仓库中发现事实.实现数据分析的前三种模型.h挖掘型工具:从大量数据中发现模式.实现第四种分析模型.电信企业参与竞争的利器-数据仓库和数据挖掘数据挖掘-Data Miningy数据挖掘是一种决策支持过程.y它的核心技术是人工智能,机器学习和统计学等y它高度自动化地分析企业的历史数据,通过归纳推理,挖掘出企业潜在的发展模型.y数据挖掘不一定建立在数据仓库的基础上.电信企业参与竞争的利器-数据仓库和数据挖掘数据挖掘-分析方法与分析过程数据挖掘有四种分析方法:y 关联分析:挖掘出隐藏在数据间的相互关系.y序列模式分析:分析数据间的前后(因果)关系.y分类分析:先定义一组标记,再赋予每条记录一个标记,从而实现对记录的分类分析.典型的分类分析模型有:线性回归模型,策略树模型,基于规则的模型,神经物理模型,y聚类分析:是分类分析的逆过程.它根据一定的规则,对记录进行合理的分类.通过分类分析可以发现分类规则,再用所发现的分类规则对记录重新分类(即聚类分析),可以发现预先对记录分类的合理性和准确性.数据挖掘步骤:y数据准备:细分为数据集成,数据选择和预分析.y数据挖掘:综合利用上述四种分析方法.y数据表达:挖掘的信息要以直观的,便于用户理解和观察的方式表达.y评价:如果分析人员对结果不满意,可以重复上述过程,至止满意.电信企业参与竞争的利器-数据仓库和数据挖掘数据融合数据融合融合的不同层次原始数据的融合特征融合模型融合融合的不同方面时间融合空间融合时间/空间或空间/时间融合系统的数据融合业务数据体系指标体系54电信企业参与竞争的利器-数据仓库和数据挖掘数据融合数据融合数据融合的高级境界战略数据分析态势评价博弈理论商场如战场-运用军事理论关键是模型的建立基础是数据仓库的建立55电信企业参与竞争的利器-数据仓库和数据挖掘动力系统动力系统企业实施数据仓库和数据挖掘战略的重要问题是建立一个有效的动力学系统反馈是一个有效的动力系统最重要的环节反馈的相关要素有反馈的量和反馈的时间延迟目前的主要问题是没有形成有效的反馈环路反馈的量不够反馈的时间太长56电信企业参与竞争的利器-数据仓库和数据挖掘反馈的解决反馈的解决建立有效的反馈通路基于WEB的计算技术增加反馈的量-到企业领导的手上移动计算人机界面数据融合缩短反馈的时间高性能计算-亿次计算57电信企业参与竞争的利器-数据仓库和数据挖掘研究研究一般人用一般的工具Normal use normal数据仓库-企业竞争的基础数据挖掘-企业竞争的秘密武器数据融合-战略竞争的武器需要有效地实施-过程与架构需要深入地研究58电信企业参与竞争的利器-数据仓库和数据挖掘我们的实践我们的实践首先在视聆通后台管理系统中应用,使用Sybase的数据仓库解决方案和BusinessObjects的联机分析解决方案,能够在3分钟的时间里对全省数据进行任意的查询,并能够通过WWW的方式进行在线分析并发布分析结果。目前与我院网络市场部合作在电信市场经营支撑系统中进行更大规模的应用长期的研究:在数据挖掘方面参与国家重点基础研究规划项目(“973”)有关海量数据库中的知识发现研究59

    注意事项

    本文(企业竞争的利器数据仓库和数据挖掘.ppt)为本站会员(豆****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开