《驾驭大数据时代.docx》由会员分享,可在线阅读,更多相关《驾驭大数据时代.docx(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、驾驭大数据时代 企业、保险公司,或者中心平安局,就如现实中的境况一般。 大数据探讨专家舍恩伯格在大数据时代一书中提出了这样三个观点:大数据不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。另外大数据具有4V特性,即Volume、Velocity、Variety、Value。 大量 我们这两年常常接触到大数据这个词,那么大数据究竟有多大?就如大是个相对的概念,并不指代详细数量,大数据也是依据近几年网络信息数据量的快速增多而提出的,最初是在2022年因为麦肯锡有关大数据的长篇报告而起先被媒体广泛接受。最近同行的看法是,量级达到PB的数据可以被称为大数据,1PB约等于1
2、05万GB,而目前手机的主流内存为2GB。当然,说大数据已经跟每个人休戚相关,并非说这个人产生或拥有了PB级别的数据,而是指他和其他人产生、运用的类似信息已经达到很大的量,须要大量的计算机进行运算。 高速 2022年,美国华盛顿高校的探讨人员曾运用15万张Flickr图片网站上的图片,构建了整个罗马城遗址的3D模型。整个3D模型构建过程共运用了496个CPU核心,耗时8小时。这种数据量虽然不是很大,但其分析的逻辑也是大数据思维。 多样 Facebook拥有500亿张以上的用户照片。2022年4月,美国波士顿马拉松期间发生了爆炸案,而Facebook的这些照片里可能就有爆炸案的线索。两三万运动员
3、,加上近50万围观群众,在同一天同一地点拍摄的照片可能有几十万张,录像可能有几千小时。用人工搜查比较明显是不行能的。那么,这就须要比照片进行分析的大数据软件。 价值 近两年流行的微博、微信,其几亿用户构建的困难关系网就须要大数据分析软件进行分析推断。微信会举荐你的手机通讯录、QQ好友上的人给你加为微信挚友。而最近,可能因为微信的强势影响,电脑客户端的QQ也起先频繁举荐一些你可能相识的人加为QQ好友。 大数据何以到来 虽然说,每个人都是不简单量化分析的,但通过支付信息,获知你收入的最大开销在什么方面,你的购物倾向;通过点餐时购买的食品,获得你的饮食偏好,饮食养分程度;通过鞋子及衣服或配饰上的各种
4、传感器收集运动量,来推断你运动类型,健康状况;通过GPS定位得到你的活动范围,你是在打车,还是坐公交,抑或步行,还是聚会或宅在家,都可以分析出来;通过电视、电影、书籍的购买与观看状况,获知你的文化消费倾向;通过你家里的厨卫用品、室温、湿度等,也可以知道你的生活环境。假如通过这些细化的方面获知你更多的信息,哪怕一个没有和你见过面的人,也会觉得对你了如指掌。 智能终端的普及 各种智能终端的廉价化和部署覆盖率的大大提高,使得大数据的收集起先变得简单。不管是监测交通的摄像头,还是手机上的摄像头,都很简单将身边的状况记录下来并数字化。另外,随着廉价的并行计算解决方案,如MPI框架、GPU计算的普及,海量
5、数据存储、计算实力如今可以很廉价地获得。 云计算的兴起 大数据真正进入日常生活,除了广泛存在的智能终端和分析软件,也是因为云计算的出现。云计算之前,传统的计算机无法处理大量的非结构化数据,云计算使得海量数据的存储和快速分析成为可能,再加上每个人都拥有的智能终端以及带宽不断增加的移动通信网络,使得海量数据的收集成为可能。 至于大数据和云计算的关系,有些人可能会有误会,并把它们混淆起来。然而,两者的区分在于,云计算是硬件资源的虚拟化,而大数据就是海量数据的高效处理。打个比方来说,云计算相当于计算机和操作系统,将大量的硬件资源虚拟化之后再进行安排运用,在云计算领域做得比较优秀的亚马逊,为云计算供应了一个商业化的标准;而最有活力的开源云平台是Openstack。 第4页 共4页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页第 4 页 共 4 页
限制150内