2022年4月中国数据库行业分析报告.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2022年4月中国数据库行业分析报告.pdf》由会员分享,可在线阅读,更多相关《2022年4月中国数据库行业分析报告.pdf(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、modb.promodb.pro20222022年年4 4月月中国中国 数据库行业分析报告数据库行业分析报告墨天轮行业分析研究中心墨天轮行业分析研究中心20222022年年0404月月乐/知/乐/享 同/心/共/济摘要摘要www.modb.pro2022年4月共有205个数据库参与排行,整体分数都有上涨,排行榜上前十被关系型数据库霸占,同时,键值、图形以及时序等类型的 NoSQL 数据库也在悄然崛起。TiDB 四月得分上涨37.31,总分616.84,稳夺桂冠。openGauss 4月得分上涨6.1%,总分567.42,夺得榜眼。OceanBase 本月分数543.22,相较于上月分数上涨53
2、.28,得分涨幅10.8%,位居榜单第三。华为GaussDB挺进前四,榜单前八得分扶摇直上,人大金仓排名上升一位,TDSQL名次连续下降至第九。AnalyticDB 本月得分虽然下跌了8.87,但是仍居第十名,并且半年内分数涨幅28.6%。TDengine 位列时序数据库榜单第一,TGDB 获得四月排行榜图形数据库第一。随着数据库应用市场蓬勃发展,需求和产品多样化,用户选择合适的数据库变得越来越难。如何能够客观全面评价数据库产品,成为研发和使用数据库的重要内容之一,数据库竞争力维度也备受关注。关系型数据库仍是主流,当前部署形态主要分为两种,分别是本地部署和云原生数据库。按照架构分类主要有三类:
3、单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。此外NoSQL、NewSQL、多模数据库等细分领域数据库市场份额也在不断扩大。据估计中国数据库市场规模2025年有望接近7百亿元,从2019年开始资本大量进入中国数据库行业,其中2021年来更是井喷式爆发,融资次数达到了20多次,融资额度超过30亿人民币。近期俄乌战局日益焦灼,西方各国相继宣布制裁俄罗斯,Oracle、IBM、微软、SAP等科技巨头相继宣布暂停对俄罗斯服务,这一系列制裁动作让技术人认识到“科技无国界”是个伪命题。俄罗斯的前车之鉴无疑给中国的数据库人敲响了警钟,开源有国界
4、吗?国内数据库以及相关从业者该走向何方?国产数据库的替代化之路还有多远呢?这些问题的解决迫在眉睫。当前,国内数据库产业呈现出百花齐放、百家争鸣的局面,新型硬件、新型交叉学科技术、新型数据模型、安全隐私等因素对数据库技术的发展起到了至关重要的作用,产生了很多的新型数据处理技术,主要包括基于新型硬件的数据管理、智能数据管理、多模数据管理、数据安全和隐私保护。但无论是产业规模,还是产品能力,跟国外主流公司和产品还有不小的差距,在政策体系、标准统一、产品能力提升、关键技术攻关、服务体系建立、企业管理规范等方面问题亟待解决,数据库产业化中的战略、人才、生态、知识产权保护与竞争等问题依旧严峻。乐/知/乐/
5、享 同/心/共/济目录目录 contentcontent一、中国数据库流行度排行一、中国数据库流行度排行二、数据库基本概念及分类二、数据库基本概念及分类三、三、发展面临的挑战和趋势发展面临的挑战和趋势四、中国数据库典型案例四、中国数据库典型案例乐/知/乐/享 同/心/共/济中国数据库最新流行度排行中国数据库最新流行度排行来源:墨天轮 www.modb.pro/dbRank中国数据库流行度排行中国数据库流行度排行是墨天轮于2019年推出聚焦国产数据库的名录和榜单,通过搜索引擎、趋势指数、三方评测、专利论文、招聘岗位等近5050个个维度的数据来考察当月国产数据库的流行度,每月更新一次,当前已经有2
6、05205个个数据库参与排行。模型分类开源占比分布式占比中国数据库厂商登记专利+论文数TOP10中国数据库概览中国数据库概览四月暖阳至,行业春风来,整体分数都有上涨,TOP10TOP10基本稳定不变基本稳定不变。TiDB 四月得分上涨37.31,总分616.84,稳夺桂冠稳夺桂冠。openGauss 4月得分上涨6.1%,总分567.42,夺得榜眼夺得榜眼。OceanBase 本月分数543.22,相较于上月分数上涨53.28,得分涨幅10.8%,位居榜单第三。华为GaussDB 挺进前四,榜单前八得分扶摇直上,人大金仓排名上升一位,TDSQL名次连续下降至第九。AnalyticDB 本月得分
7、虽然下跌了8.87,但是仍居第十名,并且半年内分数涨幅28.6%。乐/知/乐/享 同/心/共/济NoSQLNoSQL数据库最新流行度排行数据库最新流行度排行排行榜上前十被关系型数据库霸占,当所有目光聚焦在这类数据库时,键值、图形以及时序等类型的 NoSQL 数据库也在悄然崛起,奋力向前。根据 DB-Engines 的数据,在过去的几年中,图形和时图形和时序数据库成为增长趋势最快的数据库类型序数据库成为增长趋势最快的数据库类型。墨天轮排行榜上 NoSQL 数据库排名的 TOP 10,几乎被图形和时序数据库“瓜分”。在本月排行榜中,TDengineTDengine 位列时序数据库榜单第一,这是涛思
8、数据推出的一款开源的专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台。TGDBTGDB 获得四月排行榜图形数据库第一名,这是腾讯云推出的一款原生的分布式并行图数据库,其也凭借自身强劲的产品优势,正在各领域不断落地并塑造标杆。来源:墨天轮 DB-Engines乐/知/乐/享 同/心/共/济中国数据库魔力象限中国数据库魔力象限墨天轮参考 Gartner 的魔力象限模型,选取2021年年度平均分排行前40的数据库产品,通过2021年平均分、最新得分、三方评测、生态以及论文和专利数量综合评定。最后将数据汇总到两个维度上 Ability to Execute Ability to Exe
9、cute 和 Completeness of Completeness of VisionVision,根据各家数据库产品的表现,将其划分入如下四个象限中:领导者象限:领导者象限:TiDB、OceanBase、PolarDB、达梦、GaussDB、openGauss、TDSQL;挑战者象限:挑战者象限:Gbase、人大金仓;远见者象限:远见者象限:AnalyticDB、SequoiaDB;特定领域象限:特定领域象限:GoldenDB、TcaplusDB、Goldilocks、UXDB、TDengine、MogDB、EsgynDB、神舟通用。20212021年度数据库奖项年度数据库奖项最具影响力
10、数据库奖最具影响力数据库奖TiDBOceanBase达梦卓越表现数据库奖卓越表现数据库奖openGauss人大金仓GaussDB最具潜力数据库奖最具潜力数据库奖StarDBMatrixDBMogDB年度云原生数据库年度云原生数据库PolarDBGaussDBTDSQL20212021年中国数据库魔力象限年中国数据库魔力象限年度图数据库年度图数据库Alibaba GDB年度时序数据库年度时序数据库 TDengine年度内存数据库年度内存数据库TcaplusDB墨天轮通过客观中立的指标遴选,长期的跟踪分析,得以从一个侧面呈现出国产数据库的发展和繁荣,共有14家国产数据库厂商获得2021年度数据库奖
11、项荣誉。来源:墨天轮乐/知/乐/享 同/心/共/济一、中国数据库流行度排行一、中国数据库流行度排行二、数据库基本概念及分类二、数据库基本概念及分类三、三、发展面临的挑战和趋势发展面临的挑战和趋势四、中国数据库典型案例四、中国数据库典型案例乐/知/乐/享 同/心/共/济数据库基本概念数据库基本概念来源:墨天轮广义的数据库通常指数据库系统数据库系统(DBS)(DBS),其包含数据库与数据库管理系统两部分,向上通过数据库管理系统支撑应用引擎,向下以数据库承接文本、图像、声音等数据源,调动计算、网络、存储等基础资源。数据库数据库(DatabaseDatabase,DB DB)是“按照数据结构来组织、存
12、储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合,是按照一定的逻辑结构组织、存储、管理数据的大容量电子文件柜。数据库管理系统数据库管理系统(Database Management SystemDatabase Management System,DBMS DBMS)是对数据库进行统一管理和控制的大型软件,主要由内核组件集和驱动组件构成,其中内核组件集按照功能模块划分为管理组件、存储组件、计算组件和网络组件。应用系统整体架构数据库系统(DBS)数据库管理系统(DBMS)乐/知/乐/享 同/心/共/济关系型数据库基本概念关系型数据库基本概念来源:墨天轮
13、、维基百科关系型数据库关系型数据库的基础是关系数据模型,由关系数据集、完整性约束规则和关系运算三部分构成。通常情况下,关系数据集用多个表格作为数据结构来表示。用户可以定义表之间的关联。表中的列可以进行连接、并、交、差等关系代数运算。按业务负载特征进行分类按业务负载特征进行分类,关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足处理在线的实时交易事务场景,而分析型数据库满足分析业务场景,混合负载数据库目标是同时处理简单交易和复杂分析场景。随着数据库应用市场蓬勃发展,需求和产品多样化,用户选择合适的数据库变得越来越难。如何能够客观全面
14、评价数据库产品,成为研发和使用数据库的重要内容之一,数据库竞争力维度数据库竞争力维度也备受关注。TPTPOLTP(Online Transaction Processing):OLTP是能够提供实时在线处理事务,同时保证实时强一致性的关系型数据库。APAPOLAP(Online Analytical Processing):OLAP是指支持对大规模数据进行较为复杂的联机分析处理的关系型数据库。HPHPHTAP(Hybrid Transactional/Analytical Processing):HTAP是指能够同时支持在线事务处理和复杂数据分析的关系型数据库。事 务事 务处 理处 理事务必须
15、作为一个单元完成并写入数据库,否则事务的各个组成部分都不应执行。S Q LSQL(结构化查询语言)用于与关系数据库通信的接口。数 据 完数 据 完整 性整 性数据完整性指的是数据的整体完整性、准确性和一致性。A C I D 所有数据库事务都必须遵守 ACID,即必须是原子的、一致的、隔离的和持久的,以确保数据的完整性。关系型数据库重要特性关系型数据库重要特性数据库竞争力数据库竞争力高可用高可用扩展性扩展性混合负载混合负载安全性安全性高性能高性能智能化智能化关系型数据库分类关系型数据库分类乐/知/乐/享 同/心/共/济关系型数据库架构分类关系型数据库架构分类来源:墨天轮、官网当前部署形态主要分为
16、两种,分别是本地部署和云原生数据库本地部署和云原生数据库。按照架构分类主要有三类:单机、集群、分布式单机、集群、分布式。其中云原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。本地部署本地部署在本地的硬件、网络和其他基础设施上,安装的软件服务。它在真正被使用前,需要大量软硬件开发成本,并且产生很多费用;后期使用时也需要专门人员升级维护,并且需要大量维护成本。集中式集中式多台机器联合管理数据,一般不对数据进行分片。单机单机一般都是 shared everthing 架构,即共享所有计算资源(CPU、RAM、Disk)和数据。集群集群一主多备一主多备单台主机模式部
17、署,其他备机为主机备份数据且不可读,并且可以在主机宕机的情况下,代替主机提供服务。一写多读一写多读多个计算节点一写多读服务,其中一个节点提供写服务,其他多个节点提供读服务。写节点宕机时,读节点可以代替写节点来提供服务。多写多读多写多读多个计算节点共享存储,每个节点都提供读写服务。为了解决写冲突一般采用分布式锁或者集中式锁的方式来实现。分布式分布式将数据从物理上分割,并分配给多台服务器或多个实例,每台服务器可以独立工作。分布式中间件分布式中间件基于单机数据库、分库分表中间件划分数据,实现数据的划分、查询下发、结果收集,进而实现数据库的可扩展性。适合数据能够完美分片到各个节点,节点间没有数据交互的
18、场景。分布式数据库分布式数据库对数据进行分片(sharding),通过全局事务处理模块和分布式查询处理模块支持原生支持分布式事务和全局复杂查询。云原生云原生云计算技术的持续创新和成熟商用,也为分布式数据库云化部署提供了便利和可能。云原生数据库以虚拟化、分布式化和运维自动化为基本原则的云计算技术,采用通用硬件平台,提供资源快速发放、快速回收复用的弹性能力。基础架构具备“跨AZ、跨域”分布式高可用和容灾能力。分布式数据库在架构层面天然具有与云平台的高度亲和力,基于底层虚拟化技术,可以实现分布式数据库弹性伸缩,副本冗余高可用,以及跨AZ、跨“地域(region)”的容灾能力。借助云平台成熟统一的自动
19、化运维工具,可以大幅降低数据库运维管理成本,利用云平台运维监控数据实现机器学习精准训练,未来将实现基于机器学习的分布式数据库自调优、自诊断、自运维的能力。乐/知/乐/享 同/心/共/济NoSQLNoSQL数据库的基本概念数据库的基本概念来源:墨天轮、维基百科、百度百科、艾瑞咨询NoSQLNoSQL,是对不同于传统的关系型数据库的数据库管理系统的统称。,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL数据库的产生就是为了解决大规模数据集合和多重数据种类带来的挑战,特别是大数据应用难题。因为NoSQL数据库去掉了关系数据模型的特性,因此数据之间没有关系,容易进行扩展。此外,得益于No
20、SQL数据库数据模型的无关系性,数据库的结构变得比较简单,因此更容易支持海量数据的存储和高并发读写,性能比较优秀。易扩展高可用大数据量高性能灵活的数据模型NoSQLNoSQL数据库特点数据库特点适用场景:适用场景:数据模型比较简单;需要灵活性更强的IT系统;对数据库性能要求较高;不需要高度的数据一致性;对于给定key,比较容易映射复杂值的环境。NoSQL一词最早出现于1998年,是Carlo Strozzi开发的一个轻量、开源、不提供SQL功能的关系数据库。对于其最常见的解释是“非关系型”(“Non-Relational”),但“不仅仅是SQL语言”(“Not Only SQL”)的解释也被很
21、多人接受。NoSQL数据库主要包括五种类型:键值数据库(Key-Value Database)、图数据库(Graph Database)、时序数据库(Time Series Database)、列簇式数据库(Column-family Database)和文档数据库(Document-Oriented Database)。NoSQLNoSQL数据库数据库BASEBASE原则:原则:基本可用 Basically Available软状态 Soft state最终一致性 Eventual consistency乐/知/乐/享 同/心/共/济键值数据库Key-Value键值数据库使用简单的键值方法来
22、存储数据,具有较高的容错性和可扩展性。这类数据库主要会使用到一个哈希表,表中有一个特定的键和一个指针指向特定的数据。Key/value模型对于IT系统来说的优势在于简单、易部署。在不涉及过多数据关系业务的场景中,使用键值存储可以非常有效地减少读写磁盘的次数,比关系型存储拥有更好的读写性能。常见的键值数据库有:Redis、Memcached、LevelDB、TcaplusDB等。图数据库Graph图数据库是以点、边为基础存储单元,以高效存储、查询图数据为设计原理的数据管理系统。图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它使用灵活的图形模型并且能够扩展到多个服务器上。图数据库把数据
23、间的关联作为数据的一部分进行存储,关联上可添加标签、方向以及属性,这使得其在关系查询上相比其他类型数据库有巨大性能优势。常见的图数据库有:Neo4j、TigerGraph、Galaxybase等。时序数据库Time Series时序数据库主要用于处理带时间标签(按照时间的顺序变化,即时间序列化)的数据。时序数据库能够有效地处理庞大且统一的数据,其独特属性意味着可以在存储空间和性能方面提供比通用数据库更加显著的改进。比如基于统一性的专门的压缩算法可以提供优于常规压缩算法的数据处理效率;对重复或过于陈旧的数据,可以定期删除以节省空间;特殊的数据库索引还可以提高查询性能。常见的时序数据库有:Infl
24、uxDB、TimescaleDB、TDengine等。列簇式数据库Column-family列簇式数据库不同于列数据库,键仍然存在,但是它们的特点是指向了多个列,这些列是由列家族来安排的,即通过融合行键值和列来形成统一关键字,并且可以把值分成多个列簇,让每个列簇代表一张数据映射表,通常用来应对分布式存储的海量数据。常见的列簇式数据库有:HBase、Cloudera、Cassandra、GeminiDB等。文档数据库Document-Oriented文档数据库的灵感来自于Lotus Notes办公软件,是用来管理文档的。在文档数据库中,文档是处理信息的基本单位,一个文档相当于关系型数据库中的一条
25、记录。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如JSON。文档数据库可以看作是键值数据库的升级版,允许之间嵌套键值,在处理网页等复杂数据时其查询效率更高。常见的文档数据库有:CouchDB、MongoDB、SequoiaDB-DOC等。NoSQLNoSQL数据库的主要分类数据库的主要分类title:subtitleaaabbb键(Key)值(Value)container_name行键(Row Key)title1title2aaabbb值(Value)列键(Column Key)Key:value标签Key:value标签Key:value标签标签标签标签节点属性边
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 中国 数据库 行业 分析 报告
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内