当数据成为企业核心资产和创新的主要驱动力,一个坚实的数据基础是企业获得数据价值的保障。作为数据处理中枢,数据库是数据基础很重要的一部分。
在数据爆炸时代,企业的IT架构如何应对海量、多样化数据,现代化应用下的微服务又怎样依托专门构建的数据库以获得最佳表现,快速开发和迭代需要平衡数据库的成本与性能。显然,随着企业数字化转型进入深水区,业务诉求也更加“专精”。
毕竟,传统企业由于行业的特定应用需求以及历史遗留数据等原因,面临的数据挑战也更为艰巨:无法快速扩展、高成本、迭代慢、不能支撑全球业务发展以及传统关系型数据库应对不同业务场景需求的能力存在瓶颈。
“亚马逊云科技相信,云原生数据库是打破固有瓶颈,充分发挥公有云架构优势,释放数据创新潜力的必选项,” 亚马逊云科技大中华区产品部总经理陈晓建日前在接受笔者的采访时表示,数据库尤其是云原生数据库由于具有强大性能、高可用性、可扩展性、支持多场景需求且具备成本效益等优势,正成为越来越多传统行业企业的选择。
事实上,云计算解决了开源数据库在易用性、可靠性、扩展性、性能等方面的问题,相比传统商业数据库,降低了高昂的成本。通过云上托管的数据库服务,客户可以用开源数据库实现媲美商业数据库的性能,而成本通常只有商业数据库的几分之一。同时,专门构建托管数据库,为企业工作负载,尤其是现代化应用架构下的微服务提供极致性能,不同的问题由专门的数据库来解决。
此外,基于云端海量资源池的云数据库可以根据企业工作负载需求快速弹性扩展,无服务器的数据库将这一特性发挥到极致。利用云端的其他服务,包括计算、网络、存储、安全、大数据、AI/ML,通过深度集成,将各种能力融会贯通。企业可以按用量付费,无需预置资源,且托管数据库服务使客户可以集中精力在高价值的应用开发上,并借助全球数据库配合全球业务扩展。
也就是说,相比传统IT,云原生数据库能够更好地运用云的特点。例如,资源的快速扩充就是很好的例子。起初客户根据业务需要设置了固定的容量,但随着业务的发展,容量逐渐无法满足。传统数据库的可能选择扩充实例,买更多的设备和机器更新,时间和成本急剧增加。而云原生数据库可以实现后端存储资源的快速、动态和自动的扩缩容。
而且,有了云原生数据库,客户就不需要专门去配备一个昂贵的DB团队,因为这些工作完全可以由云服务商帮你解决。
谈到云原生数据库,很难不提到Amazon DynamoDB,Amazon DynamoDB是最有代表性的云原生数据库,也是业界第一个真正意义上的云原生数据库。
Amazon DynamoDB发布的背后,有这样一个故事:2004年亚马逊电商因商用数据库负载过高导致扩展失败,出现数小时的服务故障,后续统计表明:70%的数据访问并不需要SQL事务级别的复杂性。因此开始研究NoSQL非关系型数据库,并于2012年推出第一个云原生NoSQL数据库Amazon DynamoDB。
在Amazon DynamoDB问世后的十年里,亚马逊云科技对其进行的持续完善,不仅涉及底层可用性、持久性、安全性和规模等特性,还包括易用性等。现在Amazon DynamoDB已服务于全球众多客户,也包括亚马逊自身。
Amazon DynamoDB十年来的实践证明了云原生数据库是打破传统数据库瓶颈的必然归宿。
亚马逊云科技一直通过不断创新推动云上数据库服务的迭代与发展,目前已推出15种专门构建的云上托管数据库服务,既有SQL也有NoSQL的数据库类型。
在SQL服务方面,亚马逊云科技可以提供两大类型的产品:Amazon Relational Database Service(Amazon RDS),开启了托管数据库服务的新模式,从最初只支持MySQL,到目前已支持6种常用的数据库引擎:兼容 MySQL 的 Amazon Aurora、兼容 PostgreSQL 的 Amazon Aurora、MySQL、MariaDB、PostgreSQL、Oracle以及 SQL Server。
云原生数据库Amazon Aurora,是2014年推出的产品,该服务是亚马逊云科技历史上用户数量增速最快的云服务。
在NoSQL服务方面,Amazon DynamoDB:高性能扩展的键值数据库,适用于海量数据场景,譬如电商、游戏;Amazon DocumentDB,高度兼容MongoDB;内存数据库,极致响应延迟,常用于缓存、排行榜、广告等场景;Amazon Neptune托管图数据库分析万事万物的关联,用于欺诈检测,社交网络,推荐引擎;Amazon Timestream托管时序数据库,常用于IoT;Amazon Quantum Ledger Database (Amazon QLDB)托管的分类账数据;Amazon Keyspaces托管的兼容Cassandra的数据库,可以用于工业应用场景。
除此以外,还有很多具有Serverless功能的数据库,如Amazon Aurora serverless、 Amazon DynamoDB、 Amazon Timestream、 Amazon Keyspaces和Amazon QLDB等都支持Serverless无服务器功能,无服务器功能进一步简化客户在创建、维护和扩展数据库方面的工作,让数据库的扩展性及自动伸缩容量达到新的高度,其中Amazon Aurora Serverless V2可以在几分之一秒内将数据库工作负载从数百个事务扩展到数十万个事务,与按照峰值负载来配置容量相比,可节省 90% 的数据库成本。
从行业来看,数据是驱动制造业企业加速发展的关键因素。除海量、多种类型数据的挑战外,制造业企业往往还会面临如管理不同生命周期数据、解决数据孤岛等挑战。
西门子成都灯塔工厂(SEWC)是西门子中国首座数字化工厂,它主要负责工业自动化相关的产品,主要的产品是PLC可编程逻辑控制器、HMI人机交互界面和IPC工业电脑。2013年上半年投产,作为首家中国的数字化工厂,通过数字化软件、套件SIMATIC以及相关硬件实现了研发、制造、质量、管理系统的整体联动。
SEWC主要负责生产SIMATIC工业自动化产品核心的控制器,比如PRC,还有人机交互界面HMI和IPC工业电脑,供应中国以及全球的市场。数字化工厂持续致力于通过数字化的解决方案,智能制造为客户提供高质量准时交付的产品。
“如果在工厂领域,OEE系统作为一个核心系统是工厂怎么样去判定机器利用效率的重要性,我们会通过这个系统收集各种设备的状态信息。” 西门子工业自动化产品(成都)有限公司信息技术部经理 杨健表示,每一次宕机的时候就要借助自动化或者人工处理以解决相应的故障。因为每一次机器设备故障的代码是不同的,需要很有经验的资深人员分析问题、寻找解决办法,同时去更新维修记录。所以在整个处理过程中会遇到比较严重的瓶颈。
引进亚马逊云科技图数据库Amazon Neptune技术,西门子成都灯塔工厂实现基于故障的知识体系分析系统之后,有效解决了所面临的挑战:对于研发来说,可以更好地实现市场定位,快速提供决策支持,快速获取各种产品与环境的关系,设计与生产的关系、设备与产品的关系、产品与零部件的关系、零部件与材料的关系以及供应商与采购商的关系,我们就能够及时发现、及时处理。
对于生产制造来说,主要处理的是各种核心工艺、设备之间的关系,物料存储之间的关系,质量检测,生产、计划、能力、消耗等等一系列知识结构的体系化,争取能够实现动态自动的处理,为生产人员提供快速准确的应对帮助。
对于运维保障来说,真正可以做到运维的支持,比如说结构、使用手册、维护手段等等能够把它很好固化起来,同时能够通过非常友善方便而且及时专时专用的方式提供给我们的使用者。同时能够提供多元化的方式,通过多种渠道进行相关的数据采集定位,找到问题,真正降低整个产线的故障成本。
“实际上,在整个生产的生命周期我们都拥有了这样一个知识体系以后,就能够真正做到知识的不断推进。结合亚马逊云科技图数据库Amazon Neptune技术、Amazon S3存储、计算服务等能够真正实现基于工厂无缝的、无痛的基础架构的运维支撑,同时,又能够享受到高质量基于人工智能、基于图数据库的服务。这就是我们和亚马逊云科技深度合作的原因。”杨健说。
在金融行业,亚马逊云科技赋能融聚汇云原生一站式金融信息数据平台,利用亚马逊云科技云原生的高性能关系数据库服务Amazon Aurora构建一站式金融数据平台,已服务超过100+金融机构。
“基于亚马逊云科技云原生的高性能关系型数据库Amazon Aurora,我们将数据跨区存储,实现了无感灾难恢复,可用性可以达到99.99%;每秒并发查询效率也提升了近5倍,进一步满足金融业务场景高并发的需求;在成本方面,Amazon Aurora的弹性扩展能力还帮助我们节约了30%的硬件成本。” 深圳市融聚汇信息科技有限公司产品总监向坤表示,行情资讯数字化是客户实现服务升级的核心驱动力。融聚汇深度应用亚马逊云科技在数据库、网络、存储等方面的服务,构建的云原生一站式金融信息数据平台,赋能金融机构低成本、高效率地推进数字化建设。
总体来看,正是用户的需求,使得基于云、专门为应用程序构建的数据库近年来迅速兴起:不仅业务应用的处理速度和数据级别远超传统关系型数据库的能力,开源成为数据库的一个重要趋势;而且,现代化应用让业务更加敏捷,需要全托管式的云数据库来屏蔽底层复杂性。与此同时,数据库架构在发生变化,微服务成为大势所趋。
显然,一个数据库打天下不能适应未来现代化应用的需求趋势,不同场景下往往需要不同的数据库来满足应用需求。而且,客户更希望把大部分精力放在应用开发和快速创新,而不是在数据库部署、管理等各种事务。
艾瑞咨询研究总监王巍令表示:“云原生数据库将会成为未来数据库的重要趋势之一。在调研和走访中,发现不少企业尽管存在顾虑和实际困难,但是大多数也都表示愿意尝试云原生数据库。以亚马逊云科技为代表的公有云厂商,提供丰富的云原生数据库,使得企业可以安心地收数和用数,并聚焦核心业务。如果再考虑云上同时提供机器学习模型构建等服务,用数也变得简单起来。”