随着云基础设施和服务的不断成熟,云数据库管理系统(DBMS)作为核心技术之一,正逐渐从传统的本地部署向云端迁移,满足企业在数据存储、处理和分析方面的多元化需求。
Gartner数据显示,到2025年,云数据库管理系统(DBMS)收入将占全球数据库市场的70%以上,远高于传统本地部署数据库。
云数据库市场的高速增长背后,是客户对扩展性、一致性、成本效率的极致追求,以及云原生架构、无服务器计算、分布式系统等技术范式的革新。作为云计算领域的领导者之一,亚马逊云科技凭借其长期的技术积淀和持续创新,已经在云数据库管理系统的市场中稳稳占据了领导地位。
在近期发布的《2024年Gartner云数据库管理系统魔力象限报告》中,亚马逊云科技也连续第十年被评为领导者,且在纵轴执行能力维度位于最高位置。
作为云计算的开创者和引领者,亚马逊云科技在云数据库领域的创新历程也是一场不断响应用户需求创新的历程:2007年发布首个数据库服务,2009推出首个完全托管的MySQ数据库服务Amazon RDS,2012年发布首个无服务器数据库Amazon DynamoDB,以及分析数据库Amazon Redshift。在10年前的2014年,推出了云原生关系型数据库服务Amazon Aurora,能够以商业数据库十分之一的成本提供与商业数据库相同的性能。
回顾过去十年,Amazon Aurora无疑是亚马逊云科技在云数据库领域的里程碑之作。作为亚马逊云科技推出的一款高性能、全托管的关系型数据库引擎,Aurora结合了传统关系数据库的优势与云原生架构的创新,提供了出色的可扩展性、自动化管理和容错能力。
凭借其极高的性能和可靠性,Amazon Aurora成功吸引了大量企业客户,尤其是那些需要大规模、低延迟数据访问的行业,如金融、电商、游戏和互联网服务等。
10年间,随着全球化业务扩张和多区域部署成为常态,客户对数据库的强一致性、跨区域同步能力提出了更高要求。为此,2024年12月,亚马逊云科技在2024re:Invent全球大会上发布了一款重磅的数据库服务新品——Amazon Aurora DSQL,这是一款集多种数据库的理想型功能于一身的“全能理想型”无服务器分布式SQL数据库,能够同时实现低延迟、多区域的强一致性、几乎无限扩展的高可用性,以及零运营负担。
作为市场上速度领先的无服务器分布式SQL数据库,它不仅提供了卓越的一致性,还将读写速度提升了4倍,实现了99.999%的多区域可用性,具备几乎无限的可扩展性,且完全消除了管理基础设施的负担。
值得一提的是,Amazon Aurora DSQL的优势之一是在确保低延迟的同时实现强一致性,即“所有在一个区域写入的事务都将实时同步至其他区域”。
传统方法因信息在光速限制下多次往返传递,而难以在确保低延迟的同时达到多区域的强一致性要求。Amazon Aurora DSQL可以 仅在事务提交时进行一次性检查,同时并行处理所有区域的所有写入操作,从而提供具有强一致性和快速写入的多区域数据库服务。
为了确保每个区域都能以确切的顺序观察到每个数据库操作,Amazon Aurora DSQL 采用了Amazon Time Sync服务,该服务通过在每个Amazon Elastic Compute Cloud(EC2)实例上部署硬件参考时钟,使实例与卫星连接的原子钟同步,实现了全球范围内微秒级的精确时间同步。
此外,Amazon Aurora DSQL的另一大优势是“几乎无限的扩展能力”,该能力来源于其独特的架构设计和云原生特性,使其在扩展性和灵活性方面表现出色。
Amazon Aurora DSQL采用分布式架构,将查询处理层、提交层和存储层分离,允许它们独立扩展,以适应不同的读写比例、数据规模和查询复杂性。这种设计不仅消除了传统数据库的扩展瓶颈,还支持水平扩展,能够根据实际负载动态调整资源分配。
更重要的是,其无服务器特性进一步简化了扩展过程,用户无需手动管理服务器配置或进行数据库分片,即可实现从较小规模到大规模的无缝过渡。这种强大的扩展能力,结合其主–主(Active-Active)架构和多区域支持,确保了Aurora DSQL能够以高可用性和强一致性满足各种工作负载需求,为用户提供了一种灵活、高效且无需妥协的数据库解决方案。
“当你尝试构建某些东西或者做决策时,常常需要在A和B之间做选择吗?这种选择其实限制了你的思路。”亚马逊云科技首席执行官 Matt Garman将之称为“或的暴政”,它制造了这些虚假的边界,让客户只能在A或B进行抉择。但亚马逊云科技考虑更多的是如何同时达成A和B。“现在我们有了微秒精度的时间以及重新设计的事务引擎,所有要素都已具备,能够避免那些‘或’的权衡,达成‘和’的目标。Amazon Aurora DSQL能提供五个9的高可用性(99.999%)、强一致性以及低延迟的读写功能,它还与PostgreSQL兼容。”
另一方面,云数据库的竞争早已超越单一产品性能的比拼,企业客户正在将分析、ML和生成式AI相结合来获取洞察并为用户提供新体验。Gartner在报告中特别指出,云数据库管理系统(DBMS)市场依旧充满活力,并且正在进行重大变革,特别是在生成式人工智能(AI)的应用,以及数据库管理系统与其他数据管理组件的交互方式上。对此,亚马逊云科技的策略是通过统一的数据基础设施,构建从存储、计算到AI的全链路闭环。
亚马逊云科技在2024re:Invent全球大会上推出的新一代Amazon SageMaker统一的平台正是这一战略的缩影。它能够为客户提供单一的数据和AI开发环境,包含Amazon SageMaker Unified Studio、Amazon SageMaker Catalog、全新的Amazon SageMaker Lakehouse,以及全新zero-ETL与领先的软件即服务(SaaS)应用程序的集成等产品和功能。对于数据库用户而言,这意味着无需复杂的数据迁移即可调用AI能力。
在追求性能极限的同时,亚马逊云科技通过自研芯片持续优化数据库的性价比。以Graviton3自研芯片为例,与Graviton2相比,Graviton 3实例能为Amazon ElastiCache增加28%的吞吐量,为Amazon Aurora提供30%的性能提升了20%的性价比提升。2024年发布的Graviton4芯片再次提升数据库负载性价比,与上一代同类实例相比,数据库最高可提速40%。这种硬件与软件深度耦合的创新,不仅带来了更高的性能,还帮助企业大幅降低了运营成本。
更值得关注的是,已在亚马逊云科技中国区域推出的 Aurora Serverless v2凭借细粒度资源调度能力,可在秒级自动扩展至数十万事务,帮助客户节省高达90%的峰值成本,成为性价比的“利器”。全球保险科技公司Peak3的实践印证了这一价值:其SaaS平台通过Aurora Serverless v2应对6倍流量峰值,在实现“零运维”的秒级快速扩容,以及阶梯型的自动缩容的同时,将查询效率、事务处理量和响应时间等关键性能指标也得到有效提升。
写在最后
总的来说,从首款Amazon Aurora数据库的发布,到如今的Amazon DSQL,亚马逊云科技十年的持续耕耘不仅推动了云数据库的技术演进,还重新定义了云数据库的扩展范式,为全球数以万计的企业提供了强大的技术支持,确保它们在复杂的数据环境中实现高效运营。
正如Matt Garman所言:“我们拒绝‘或的暴政’——不是选择A或B,而是思考如何同时实现A和B。”这种以客户需求为锚点的创新机制,结合对基础设施的端到端掌控能力,构成了亚马逊云科技难以复制的技术护城河。