数据,作为继劳动、土地、资本、技术之后的新的第五大生产要素,正在深刻改变着人们的生产方式、生活方式和社会治理方式,被视为数字经济新引擎。

要想帮助数据释放出生产要素级别的价值,基础设施必须先行。作为数据要素的基础设施,“数据库”技术的重要性,不言而喻。

4月7-8日,由中国DBA联盟(ACDU)和墨天轮社区联合主办的主题为“开源·融合·数智化——引领数据技术发展,释放数据要素价值”的第十二届数据技术嘉年华(DTC 2023)在北京举行,从多元化类型的数据库技术创新、应用实践、发展趋势等维度,为数据库从业者带来一场数据库前沿洞察与技术实践的盛宴。

 中国DBA联盟理事长、墨天轮社区发起者、云和恩墨创始人/总经理在盖国强(Eygle)在致辞中表示,中国数据库产业界正在崛起,有越来越多的产品和思考已经跻身到世界的尖端。在墨天轮排行榜上,已经有超过260个中国数据库品牌在列,SQL和NoSQL产品齐头并进,集中式、分布式各领风骚,开源和闭源皆阵列在前,中国数据库产业界正在呈现丰富多彩、百花齐放的生态格局。

纵览这场数据技术嘉年华,我们感受到了开源、融合、数智化、国产、内核这五个关键词的真切冲击。开源、融合、数智化三个关键词,已写进大会主题;而国产、内核作为明显的“隐藏款”关键词,锋芒毕露。

开源

软件是信息技术的灵魂,是数字经济的基础。而近年来,开源在推动信息技术产业创新、加快数字化转型方面愈发重要。“软件吞噬世界,开源吞噬软件”成为共识。

作为基础软件重器,数据库理所当然地为开源所影响。

DB-Engines的数据显示,2021年1月,开源数据库的流行度首次超过商业数据库。全球383款数据库中,开源数据库占据51.7%,排名前十的数据库中,开源数据占据六席。而据墨天轮中国数据库流行度排行榜显示,排行榜前五名中,有三个是完全的开源数据库产品。开源,正在成为中国数据库产业发展的新潮流。

融合

当前,融合、简化作为用户的基本诉求,正在推动数据库从功能分离到一体化的融合发展。事务和分析型融合、多模融合等一体化的设计,在阿里云瑶池数据库、腾讯云TDSQL、OceanBase等众多产品中成为现实和常态。

以阿里云为例,据阿里巴巴集团副总裁,阿里云数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞介绍,阿里云数据库聚焦客户业务场景,通过多产品一体化体验,简化开发、管理和运维,避免数据搬迁,包括处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化。

数智化

回首数据库短短五十余年的历史,可以发现数据库的演进可谓翻天覆地。但无论如何发展,都离不开两个方面:向下能够发挥算力能量,让硬件发挥更大的效能;向上能够支撑不同的应用,从传统的交易型、分析型再到现在的混合型,从原来把数据库放在一个盒子里到现在的开源开放。

数据和人工智能相互融合,探索数据的价值,为数据库发展开辟了新的方向。在当前人工智能时代,一方面,DBA有机会可以广泛借助智能手段,融合人工智能能力的数据库自治服务,实现智能化运维,提升运维效率与体验;另一方面,数据库通过内置机器学习功能,可以为模型训练、生成推理和预测提供支撑。

数智化已然成为数据库的标配。

同时,在云时代,前沿的从业者还在进行更多的关于数智化的探索。清华大学交叉信息研究院(姚班)助理教授张焕晨认为,几十年来,数据库系统研究的重点是在固定资源的条件下优化性能。随着越来越多的数据库应用迁移到云端,云数据库的使用成本应该和性能一样成为数据库优化问题中的一等公民,由此他定义了“成本智能”的概念,并勾勒出一个为成本智能而设计的云数据仓库的架构。

国产

数据库作为重要的基础软件,近年来发展迅猛,创新不断,成绩喜人。

工业和信息化部电子五所信创负责人李冬分享说,当前,国产数据库市场呈现开源、商业、云数据库三足鼎立,分布式数据库、集中式数据库齐头并进的态势,并且在时序数据库、图数据库领域发展居前列。而以TDSQL、PolarDB为代表的国产数据库,在国际的测评上都取得了不错的成绩。

同时,国产数据库品类日益丰富。相关数据显示,中国有200多家数据库厂商,涵盖自研闭源、自研开源、开源引用、商业授权四大类,通过不同的角度探索中国数据库的发展之路。而随着数据库领域创新企业的不断涌现,中国数据库的产业格局也在向核心关键技术的纵深的突破,openGauss、TiDB等始于国内的根社区和根生态正在形成。

针对国产数据技术生态不够完善、专业人才缺口大、部分产品同质化严重、关键场景验证不足等问题,李冬有四个建议:

  • 全面、深刻理解数据库分类体系及发展格局,探索多元化发展路径;
  • 鼓励在不同的细分赛道上做差异化的竞争,引领新赛道创新格局;
  • 期望用户能够释放出更多的应用场景,给国产数据库企业一个大展宏图的舞台;
  • 建立繁荣的开源生态,借力开源实现技术超越与供需融合。

华为云和腾讯云作为国产数据库先锋,在峰会上分享了他们的国产化进展。

据华为云数据库服务产品部副总经理庄乾锋介绍,在面向金融政企的国产分布式数据领域,GaussDB在高可靠、安全、性能方面的多项新特性,全面超越国外主流数据库产品,并在面向互联网的云原生领域,云原生数据库完成三大转变,实现Serverless、Regionless、Modeless的全新架构演进。

腾讯云数据库总经理腾讯云王义成分享了在国产化浪潮下,TDSQL在积极推动数据库技术实现安全可控,目前在政务、金融、运营商等传统重点行业已有超过600家落地实践经验,为国产化数据库的发展和应用积累了宝贵经验。

内核

“内核”的开发,不管是操作系统,还是数据库,都是最难的事情。但再难啃的骨头,总有一群人矢志不渝、乐此不疲。

CCF数据库专委会副主任,openGauss社区技术委员会主席,清华大学计算机系副主任、长聘教授李国良分享说,openGauss持续围绕高性能、高可用、高智能、高安全这“四高”突破创新数据库核心技术,构筑数据库内核竞争力,打造企业级开源数据库。openGauss自开源以来,在社区共同的努力下,近三年来实现下载量突破160万,汇聚了4500+开发者和230+企业成员,openGauss发布了多个LTS版本,在“四高”方面不断探索。

仅仅成立不到两年时间的本原数据,主力团队来自云和恩墨,先后发布了企业级关系型数据库MogDB和超融合时序数据库Uqbar,并成功应用于多个行业核心应用场景。他们的目标同样聚焦内核,用本原数据技术合伙人张程伟的话来说:“回归数据库技术本原,做难而正确的事”。本原技术的另一位技术合伙人金毅的发言掷地有声:“无论数据库跑在哪里,不管是线下还是云上,私有云还是公有云,分布式还是集中式,终归都需要一个内核在一台机器上跑起来。所以说,一个强大的单机内核是技术创新的重点,是数据库技术的本原。”

开源、融合、数智化、国产、内核这五个关键词,只是中国数据库产业的缩影,只要生态各方戮力同心,更多的关键词、更多的创新,必将奔涌而至,数据要素的价值将得到全面释放。

点点星光汇聚成星河,万众期待的数据库的中国时刻,来了!

Logo

20年前,《新程序员》创刊时,我们的心愿是全面关注程序员成长,中国将拥有新一代世界级的程序员。20年后的今天,我们有了新的使命:助力中国IT技术人成长,成就一亿技术人!

更多推荐