ojmavpkn.docx
《ojmavpkn.docx》由会员分享,可在线阅读,更多相关《ojmavpkn.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、受访者|邵宗文,腾讯云图数据库产品经理记者|夕颜出品|CSDNID:CSDNnewsAI技术生态论人物访谈栏目是CSDN提议的百万人学AI建议下的重要组成局部。通过对AI生态顶级大咖、创业者、行业KOL的访谈,反映其对于行业的考虑、将来趋势判断、技术理论,和成长经历。本文为AI技术生态论系列访谈第三十四期。百万人学AI你也有份!今日起,点击浏览原文报名2020AI开发者万人大会,使用优惠码“AIP211,即可免费获得价值299元的大会在线直播门票一张。限量100张,先到先得。近日,又一国产数据库诞生!这次是腾讯家推出的分布式图数据库产品腾讯云数图TGDBTencentGraphDatabase
2、。据称,这款数据库可以实现万亿级关联关系数据实时查询,高效处理异构数据,支持实时图计算。从理论上讲,该图数据库的集群节点规模可以到达万台以上,在不同的公开数据集下查询速度比世界市场占有率最高的Neo4j快20-150倍!在近年度,图数据库逐渐火爆起来,据Gartner在?十大数据分析技术趋势?预测,2021年度至2022年度,全球图处理及图数据库的应用都将以每年度100%的速度迅猛增长,DBEngines近7年度数据库流行趋势也显示,图数据库相较其他主流数据库受欢送程度遥遥领先。此前,业内主流图数据库产品主要为国外厂商,国内金融、电商、能源等重点行业只能依赖于国外图数据库产品。在此背景下,关于
3、我们什么时候能拥有真正能知足国内企业需求的强大国产数据库,成为大众关心的热门话题。好在随着大数据,尤其是图数据的重要性被更多厂商意识到之后,国内大小厂也相继推出了自己的图数据库产品,试图打破国外技术厂商的垄断,包括大厂阿里云的图数据库GDB,蚂蚁金服自主研发的分布式图数据库GeaBase,华为的GraphBase,小企业如杭州欧假设数网科技也有自己的图数据产品NebulaGraph,维加星信息科技的TigerGraph等。按照理论,从技术适配性、平安性、本钱上来讲,国产数据库产品应该更加符合国内企业的需求以及信息化的节奏。事实上是这样吗?我们今天的关注重点,是与已经发布的图数据库产品以及国外数
4、据库产品相比,腾讯云数图新发布的这个TGDB有哪些十分之处?是否比它们更有优势?为此,CSDN邀请到腾讯云图数据库产品经理邵宗文,来从研发背景到上层设计,全面评估一下这个图数据库产品是否名符其实。TGDB的研发背景在5G、物联网、人工智能等数字化技术的推动下,企业数据呈爆发式增长,数据间的关联复杂度也随之剧增。传统关系型数据库在处理复杂关联数据时运算效率较低,且难以帮助企业进一步挖掘海量关系数据背后的价值。为了更好地利用数据间的连接,企业需要一种将关系存储为实体、灵敏拓展数据模型的数据库技术,腾讯看到了图数据库潜藏的时机。在深化调研后,腾讯发现客户其实往往需要的是一辆车,除了制造图数据库发动机
5、之外还需要一系列合作伙伴来做配套,才能知足企业的需要。目前,腾讯的图数据库生态构成主要都是行业顶尖数据库人才以及及相关上下游合作伙伴,其中有海归,以及10多年度数据库领域的资深专家构成,重点研究方向包括图数据库分布式存储、高性能计算、图算法,和生态组件如迁移工具、可视化、数据抽取、数据建模等。图数据库技术上的打破相比于国内外其他图数据库产品,TGDB有一些独特的特性。总的来讲,正是因为TGDB在技术上的一些打破带来了性能上的提升以及架构上的灵敏扩展,才实现了全新的特性,包括去中心化纯分布式架构、高效的原生存储、图切割以及分布式算法等。去中心化分布式系统架构据邵宗文介绍,TGDB采用了去中心化分
6、布式架构,理论上支持线性扩展,从目前的部署以及使用来看,TGDB的图数据存储极限还远没有到达极限,在实验室中,团队曾在测试中测得图数据集群节点数量为100台,但根据理论推演,TGDB图数据库的集群节点规模可以到达万台以上,在不同的公开数据集下查询速度比世界市场占有率最高的Neo4j还要快20-150倍。如此大规模的存储极限以及极快的查询速度,与TGDB的系统架构设计分不开。TGDB分布式图数据库从内部架构上主要分3层:资源管理层:负责对底层计算与数据资源进展管理以及调配,简单地讲,就是负责协调把每个计算任务以及对应的数据按照某种算法分发到各个分布式节点上执行、监控、容错并汇总结果;数据抽象层:
7、提供了属性图PropertyGraph的抽象,涉及到图的数据构造、存储方法、访问形式以及消息协议;上层算法应用层:提供了基于分布式计算引擎的算法,这些算法需要访问数据抽象层的图数据,按照每个算法不同设计,把算法的执行变为可以分布式并行处理的单元,交给资源管理层执行。TGDB图数据库系统在集群部署的架构是完全分布式去中心化的,各个节点都很平权,不存在单master的单点故障或者为了防止该问题而导致的系统复杂度。底层数据一致性基于一套稳定的消息队列以及快照机制,使得任何节点以及经过都可以假设一个虚拟的稳定的中间信息交互平台,并且平台保证消息的全局一致性、排序、最高一次送达等保证,同时支持多份热备,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ojmavpkn
限制150内