大数据架构体系下的数据挖掘模型讨论.docx
《大数据架构体系下的数据挖掘模型讨论.docx》由会员分享,可在线阅读,更多相关《大数据架构体系下的数据挖掘模型讨论.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据架构体系下的数据挖掘模型讨论摘要:在这个时代里,从规模经济到范围经济,从搜索经济再到推荐经济,数据挖掘经营开启了“智领革新、“智在发展的新征程。文章以大数据架构体系下的数据挖掘模型为主线,从大数据环境本身的特点、当前典型企业对大数据技术的应用战略形式和数据挖掘模型等方面对大数据技术进行分析。关键词:大数据;数据挖掘;模型研究1研究背景伴随着互联网、云计算、移动互联网和物联网等一系列ICT技术迅猛发展,用户数以亿计的互联网服务时刻产生巨量的信息交互,类似Web数据、传感数据流等个性化的非构造数据在互联网整个数据量中的比重逐步上升,数据的种类、复杂度都在大大增加,不再仅是处理企业内部构造化的
2、数据,更多是无法用数字或统一的构造标识的非构造化数据,如文本、图像、声音、网页等。诸如以上创新因素,大数据应用与价值挖掘成为产业最为关注的热门课题,“IT与“经营的日趋融合,在大数据推动的商业革命与商业竞争暗涌中,要么学会应用大数据杠杆创造商业价值,要么被大数据驱动的新生代商业系统所淘汰。2大数据的架构体系与发展特征大数据技术被称为“地球的神经系统,它背后蕴藏价值堪比石油,业界将其特性归纳为4个“VVolume,Variety,Value,Velocity。其发展从其根本上是从传统的构造化数据处理形式走向当代非构造化的海量数据处理的一次根本性飞跃。目前,以大数据为核心的产业链正在构成,当前主要
3、包括三层:第一层是企业内部交易数据和企业外部的用户行为数据、物联网数据;第二层是信息层,产生如数据包销售、租赁等业务形式;第三层是知识层,需要人工参与,提供融合行业信息。大数据及其数据挖掘理论体系的创生发展赋予了产业更多的发展特征。1以人为中心的全方位需求知足成为产业的价值诉求,互联网生态构造发生再生于重构。全天候、全业务、全生态、全终端、全形式等以客户为中心的全方位需求知足,是大数据发展终始目的,大量智能移动设备接入网络,移动应用爆发性增长对数据进行深化挖掘的需求突显。2数据世界技术发展的重点已不再是数据存储,而是数据应用,数据价值挖掘成为数据的应用的关键和核心。从传统互联网到移动互联网,数
4、据时时刻刻、分分秒秒都在成几何级的增长。而诸如twitte、facebook、google等也天天都在为数据的获取与价值挖潜而劳碌奔波。3基于用户行为分析,互联网营销趋向“开放-主动-整合,“搜索+推荐成为互联网发展的新主导行为形式。3“平台聚合+数据挖掘的创新形式讨论3.1以阿里巴巴为领衔的商务平台大数据共享形式阿里巴巴推出淘宝开放平台,开展“数据共享平台战略,大数据产生的价值已深化地影响了企业的经营和管理,怎样有效管理和应用大数据也为企业提出了宏大的挑战。天猫与阿里云、万网公布联合推出淘宝开放平台,是基于淘宝各类电子商务业务的开放平台,提供外部合作伙伴介入服务淘宝用户的原始数据分析。为天猫
5、、淘宝平台通过对全平台内的交易信息和用户行为等信息进行分析,为商家提供推荐参考及其他个性化服务,以此进一步加强本身平台和商家之间的粘性。3.2以Facebook为领衔的社交平台大数据分析形式“大数据技术对于社交网站的核心价值在于数据的挖掘和应用产生的多方位价值。Facebook构筑了多系列化得开放平台,除本身所具备的社交网络属性外,在功能设计和页面更新上均注重获取多维用户信息,力求全程记录和沉淀用户的行为数据。由此获取的大量数据将成为将来Facebook的核心资源与竞争优势。情感分析是近来社会媒体的大热趋势,其目的在于帮助公司了解消费者对于其产品的看法,是一个很有效的实时反应系统,能够监测广告
6、的有效性进而预测广告投放的结果。3.3以IBM为领衔的数据服务分析平台大数据创新形式大数据时代,怎样对极大量的数据进行及时的处理、高效地存储和管理,成为了拥有大量数据的企业所要面临的主要问题。而相应的,这也就为拥有丰富强大数据管理和计算能力的数据服务类企业带来了时机。IBM推出了云计算平台作为一个并行分布式系统,通过低成本和高扩展性的方案对现有数据仓库系统进行加强和延伸,提升了仓库存储和商业决策分析能力,进而支持了大数据处理,为使用大数据的企业带来了方便。4数据挖掘典型模型构建:知识发现与价值挖掘的衍生数据挖掘则将“大数据转化为“大洞察的方法论体系,它是一种透过数理形式来分析企业内储存的大量数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 架构 体系 挖掘 模型 讨论
限制150内