无往不利的国产数据库生态建设策略

来源:互联网 阅读:- 发布:2024-04-09 12:07:11

从区域结构来看,长三角地区属于一个主体和多个子部分的结构。《长三角地区一体化发展总体规划》要求“上海发挥领先作用,江浙沪皖发挥各自优势,加强跨地区协调互动”。

这个数据库已经有60年的历史了。比如国产数据库Oracleeclee,在2020年之前就被美国垄断了。、DB2SQLserverPostgreSQL开源数据库、MySQL。近年来,国内数据库逐渐加强,逐渐进入金融、证券等中国核心系统。虽然国内数据库Vendor的技术与Oracle还有差距,但目前最重要的症结不是技术本身,而是数据库生态的构建。

国产数据库生态是指交流、合作、供需满足等基于DBMS软件产品和服务组织和个人之间相互作用的环境。一个成熟的数据库生态系统不仅包括功能齐全、性能优越、性能稳定的系统,还包括完整的文档和知识库、丰富多样的开发和运维工具链、典型的应用案例和评估报告,以及一批经验丰富、系统熟悉的开发者和用户。典型的数据库生态系统包括OracleIBMDB2、以MySQLServer为代表的MicrosoftSQLServer商业数据库生态系统、以PostgreSQL为代表的开源数据库生态系统,以TPC为代表的事务性能标准评价生态系统。数据库是DBMS软件产品稳定发展和商业成功的关键,也是目前国产数据库系统最缺乏的一个方面。

下列三个方面是我国国产数据库生态建设的重中之重。

1、构建数据库评估标准

评价标准是评价数据库系统最重要的标准,是选择数据库系统的重要依据,也是推动数据库系统研发的主要动力之一。因此,评价标准可以说是支撑数据库行业40多年健康发展的最重要支柱之一。例如,随着TPC系列标准的出现和发展,许多相关数据库管理系统制造商可以在公平开放的环境中竞争。

在数据库系统普遍适应云计算平台、选择分布式架构、提供越来越多新的数据类型支持和新的数据管理和数据处理服务的场景下,以TPC系列为代表的当前评价标准无法满足当前和未来系统的比较、系统选择和指导。&D、规范行业需求。同时,它是企业和行业标准的基础和前提,形成能够反映中国应用需求和系统制造商优势的评价标准,也是规范国产数据库行业,培养国产数据库系统的前提。

分布式数据库系统的准确性测试:新的数据管理系统通常采用分布式结构,以实现可扩展性、高性能和高可用性。分布式结构还带来了复杂的并发控制协议,支持分布式事务的可扩展性和尽快恢复的分布式共识协议。协议的准确性和项目实现的准确性将影响分布式数据库系统的正确运行。一套完整的分布式数据库事务准确性测试方法和一套开放易用的测试工具,有必要推动分布式数据库系统的研发,推动新数据库系统在关键任务应用中的实现。

评价标准应用的构建方法:随着数据管理系统在信息系统中的作用的提高,其应用范围和多样性比它诞生时有了质的飞跃。图灵获得者MichaelStonebraker2014年提出了经典结论。Onesizedoesnotfitall!还有迈克尔杰。Carey认为,国产数据库系统的发展将会显示出“Onesizefitsabunch“趋势,即每个具有相似特征或需求的应用程序都会有不同的数据管理系统。近几年,国内外出现的新型数据库系统验证了这一趋势的到来。“Onesizefitsabunch“不但要突出新系统的出现,而且要体现在相应的评价标准上。“TPCbenchmark系列的本质是使用”Onesizefitsall"模型对所有系统进行评估。但一般缺乏开放权威的评价标准,如云环境、嵌入式环境、卓越事务管理、多模态数据管理、机器学/AI数据管理应用等。一方面,设定一个稳定的标准来满足所有的应用需求是昂贵的,另一方面,它不能适应不断变化和发展的使用场景。构建典型应用的评价标准,开发面向应用的评价标准构建方法和理论,实现定制的评价标准构建工具,是形成适合新数据管理系统和应用开发的评价标准,进而保障国产数据库industry发展的前提。

新数据库系统的评价标准:新数据库系统的形式、服务提供模式和依赖硬件配置(云数据库、分布式数据库、AI原生数据库等))变化很大。传统的响应延迟、系统吞吐量等特性评价指标已经不能准确、全面地反映新系统的特点。例如,对于一个几乎可以线性伸缩的系统,系统的最高吞吐率和单机的平均吞吐率都无法反映出系统的可扩展性。应用数据库制造商和应用数据库制造商迫切需要新的评价标准来评价云服务水平和系统可扩展性。

2、开源数据库的生态建设

Ingres是最早的关系数据库系统之一,它在开源数据库系统的发展中发挥着重要作用,它在诞生之初就使用了BSD协议来开源;MySQLPostgreSQL都是开源系统,拥有广泛的用户;SQLite也是安装量最大的数据库系统。而且,即使是Oracle、商业闭源数据库系统,如IBMDB2,也依赖于一个庞大的开源生态系统,其中包含了许多开发和操作工具。

3、产学研究与深度合作

数据库涉及的技术链条较长,内部模块耦合度高,与软件栈和硬件平台的其他部分高度相关。无论是数据库系统的核心研发、评价标准的构建,还是开源生态的构建,都需要产学研双方的密切合作。

近几年,华为GaussDBPingCAPTiDB、奥星贝斯Oceanbase、国产数据库系统,如阿里PolarDB,已经开始通过开源构建多方参与的社区生态。与此同时,数据库制造商也通过项目与大学和研究机构进行了广泛的合作。代表性的合作计划包括CCF-华为数据库创新研究项目、腾讯犀牛鸟项目、阿里Air项目等。这些项目使制造商和研究机构形成了相对稳定和密切的合作关系。

数据库系统的发展越来越具有“应用驱动创新”的特点。系统的发展受到应用需求的刺激和驱动。目前,在数据库系统的研发和生态建设方面,数据库系统制造商与高校、科研院所等研究机构合作较多,系统制造商与应用程序方也有密切合作。然而,联合参与的产学研合作仍然不多。与美国、欧洲等先进大学和科研院所相比,中国科研院所面临R&D系统原型的应用,然后只需通过开源或单位合作的方式进行孵化或转换,最终形成一个知名的模式。

4、总结

数据库生态建设是促进国产数据库系统和产业健康发展的关键,也是促进国产数据库系统助力产业数字化转型、取代国外商业数据库系统关键核心任务的关键。

建设数据库生态需要开发评估新应用场景的方法和工具,构建积极参与、紧密互动、不断成长的社区,培养包括用户、产业链制造商在内的社区。R&包括D梯队在内的社区团队。对国产数据库系统制造商而言,开源是构建这种生态系统的有效途径。

围绕国产数据库系统进行生产、学和研究用户的密切合作才刚刚开始。在现有开源和项目合作的基础上,需要在应用端做大量的工作引入,同时将合作延伸到基础人才的培养上,探索国产数据库系统R&D和生态建设的新途径。


推荐阅读:叶紫网