传通通计数据和大数据探究.docx
《传通通计数据和大数据探究.docx》由会员分享,可在线阅读,更多相关《传通通计数据和大数据探究.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、传通通计数据和大数据探究从传通通计数据与大数据之间的演变历史、数据特征等方面展开讨论,厘清两者之间存在的千丝万缕但又千差万别的联络,提出传通通计数据是大数据的简单形式和初期阶段,大数据是传通通计数据的复杂演化形态的论断,指出两者在数据分析思维方式上存在宏大差异,并对数据质量管理内涵、全周期数据质量保证等问题提出不同的解决思路和方案。关键词:传通通计数据;大数据;数据分析;数据质量0引言传通通计数据的内涵在于揭示数字背后信息与现实世界的关系。大数据是指巨量数据,是无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。从传通通计数据到大数据的持续演变导致在理论层面大数据内涵复杂,并
2、与传通通计数据在信息界线上概念模糊。从传通通计数据到大数据不仅是量的积累,更是质的飞跃。厘清传通通计数据与大数据之间的内涵辩证关系,是有效利用数据的基础和关键。1传通通计数据向大数据演变的动力信息技术的进步为传通通计数据向大数据演变提供了物质和技术基础。随着互联网的日益发展,每一次网络存储技术的进步都使信息的生产、存储、传输成本大幅度降低,而流通的范围、深度、速度则显著提升。JimGray的新摩尔定理以为,每18个月全球新增信息量是计算机有史以来全部信息量的总和,新摩尔定律以信息量的维度确定了数据化演变信息的节拍。这种趋势导致的基本形态就是数据信息空前丰富,大数据成为了研究和利用热门。信息需求
3、多样化与个性化是传通通计数据向大数据演变的基本动力。数据最终是为信息需求服务的,用户信息价值最大化才是数据应用的关键所在。在数据化趋势下,随着人们认知实践与需求状态的变化,数据一方面从知足基本特定信息需求到利用复杂的数据属性解析出多样化信息需求转变,另一方面从被动知足简单需求到主动开掘复杂有效需求,并探知用户个性化信息需求转变。这两方面成为传通通计数据项大数据内涵演变的基本动力。相应地,数据内涵也从朴素的信息真实业务逻辑向知足复杂需求的数据化逻辑迁移。随着信息技术的发展和用户需求的变化,信息效率价值的实时化及数据泛滥造成数据噪声加强和有效信息稀缺现象,大数据应运而生。传通通计数据是大数据的简单
4、形式和初期阶段,大数据是传通通计数据的复杂演化形态。2传通通计数据与大数据的数据特征差异数据量增加是人们区别传通通计数据与大数据的第一个认识。传通通计数据数据量小,以MB、GB、TB等为存储单位。大数据数据量大,一般以PB、EB、ZB等为存储单位。但这两者之间特征区别并不仅仅是体量,还包括数据类型、研究对象的范围、信息视角等方面。2.1传通通计数据与大数据的数据类型比照传通通计数据是一种构造化的标准数据。其数据类型单一,主要以构造化、体量小、标准化、价值密度高及周期化数值为特征,数据产生和变化的速度慢。其数据特点是朴素真实、简单有限、准确性高及被动有用性。大数据统计范畴扩大、数据类型复杂,其中
5、包括:a非构造化非标准数据,如动态实时时序数据。b半构造化数据和非构造化数据,如文本、图像、视频等。c现有的构造化数据,如传通通计数据。其数据模型具有复杂多维的特征,统计结果多是非准确多种相关性趋势数据。大数据具有4个V基本特征,即Volume体量浩大、Variety模态繁多、Velocity生成快速和Value价值宏大但密度很低,且具有;多样、实时、多元的信息化特点。这些特点导致数据在产生、获取、存储、传输和计算经过中,因体量大、快速多变易产生冲突和不一致,人工很难检测和修复。2.2传通通计数据与大数据的研究对象范围不同传通通计数据的研究对象是宏观视角下有限的随机样本数据。随着信息化的发展,
6、实践中产生大量冗余沉淀数据,这一时期经过清洗的全样本数据是数据挖掘的研究对象。而大数据面对的则是原生态全样本数据,也就是所谓的总体数据。从随机样本数据到经过清洗的全样本数据再到原生态总体数据,数据内涵总体信息视角从宏观向中观和微观扩散。研究对象范围向宽度和深度两个方向不断扩展,不断深化系统微观的多维度个体感悟,信息能力和价值也不断提升。这种转变来自技术和需求的驱动,新型数据处理技术及需求获取能力成为演变的关键因素。3大数据相对传通通计数据分析方式的变革数据中蕴含的珍贵价值成为人们存储和处理数据的驱动力,数据分析是实现数据价值的必要途径。由于传通通计数据与大数据在体量、构造、内涵等方面有着本质的
7、区别,所遵循的数据分析理论基础、分析思路、相关技术也不同。3.1传通通计数据与大数据数据分析的理论基础对传通通计数据进行数据分析的理论基础是分布理论,以概率为保证,即根据样本去推断总体特征,其逻辑关系是“分布理论概率保证总体推断,分析经过是“假设验证基础上的“定性定量再定性。对大数据进行数据分析是以全体数据为基础,以数据信息相关为保证,其逻辑关系是“实际分布总体特征概率判定,能够不受任何假设的限制去寻找关系、发现规律,分析经过是“定量定性及“发现总结重要数量特征和关系基础上的定量回应。3.2传通通计数据与大数据数据的分析思路传通通计数据价值的实现途径为“数据到信息再到知识和智慧。传通通计数据分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通通 数据 探究
限制150内