AWS：修炼"内功"驱动力 | 数字商业时代

“每个人都在经历整个IT的变化，从最早的Database、ERP到移动互联网推动的工作负载的变化，再到未来可以预见到的机器学习，这些都在驱动整个工作负载变化的趋势。” AWS大中华区云服务产品管理总经理顾凡在接受笔者的采访时表示，亚马逊云服务（AWS）的Amazon EC2有一个很重要的使命，就是要服务云上所有的工作负载——横跨各个行业的实例类型，为客户的工作负载去量身定做各种各样的计算。

事实上，随着数字化浪潮的不断深入，云计算的创新也从未停止脚步。云计算是产品的服务化，并不是简单的卖给客户服务器，或者存储那么简单。而作为服务模式，就更需要提供商的运营和经验的积累，满足客户急需的产品迭代需求。

“从产品的角度来看，AWS的弹性计算主要分为四个维度：多元选择、安全可靠、多维赋能企业应用以及高性能计算。”顾凡表示，同样提供的弹性计算服务，其实也有深度和广度的区别——AWS是唯一有ARM和Mac OS实例，同时也是唯一一个CPU频率能够稳定在4GHz以上的服务提供者。

具体来看，从提供的服务中，AWS一直提倡的是把选择权交给客户：一方面从操作系统的选择上，Linux、Windows，包括今年发布的针对Mac OS的支持。这里值得一提的是，亚马逊也有自己的Linux系统，会针对AWS服务和Docker容器服务做一些优化，无需额外付费，AWS会提供五年的支持。

另一方面，在处理器的选择上，AWS也可以提供x86、AMD、ARM等主流处理器。针对不同的客户量体裁衣的需求，完全可以分为计算密集型、内存密集型、存储、IO敏感、吞吐敏感、网络延迟敏感的应用。

Intel与AWS保持了长达14年深度合作的合作伙伴关系，双方合作为客户提供了很多定制的实例。C5n是与Intel当时合作的支持100G网络带宽的专有的实例，现在已经升级到400G，是当前支持最大24TB大内存的实例的唯一提供商。“把选择权交给客户，就是我们把对于处理器和每一个实例的选择权交给客户，从操作系统、到处理器的选择上，客户可以基于自身的需求选择。”

值得注意的是，2018年，AWS第一次对外推出了基于ARM架构的AWS Graviton第一代CPU的芯片。在2019年的re:Invent大会上，宣布推出了第二代，并在2020年正式让客户开始使用AWS Graviton2。这是我们最新的基于ARM架构的自研的芯片，也是第一个真正的以云为原生去设计的适合运营上面的现代化应用负载提供的云服务的芯片。AWS将其定位为是为云原生的应用而定制的一款处理器。

过去几十年的CPU发展，频率的提升已经逐渐放慢，更多是内核数量的增加以及对多线程、多进程的应用的支持。随着CPU发展的变化，无论是操作系统还是软件的设计编程的语言和整个应用的架构，都越来越转变去适应这样CPU发展的特点。

“所以，我们看到这些新的应用软件、编程工具开发的应用，都更适合于可以平行扩展的架构，去充分地利用CPU的多个核、多个线程、可以并行处理多个任务的特点去发展出来的能力。”AWS大中华区产品部计算与存储总监周舸表示，现在云上蓬勃发展的微服务化的现代化的应用，会把传统应用架构拆细分布在很小的微服务化上，然后做快速的平行扩展。极大地利用了多核、多进程的处理能力的CPU架构带来的优点。

据了解，2021年1月14日，Graviton2 CPU的实例已经落地到中国的光环新网运营的北京区域和西云数据在运营的宁夏区域。

“从2019年第一代到Graviton2现在的积累，我们已经看到了非常丰富的生态的配合在ARM上面，例如，当前主流的Linux操作系统可以运行在两代的Graviton的实例， Docker和EKS的容器服务也都已经支持，同时AWS自己的Hadoop的 ERM服务，也支持Graviton2的实例。”周舸补充道。

涂鸦智能是一家全球化AI+IoT的企业，连接消费者、制造品牌、OEM厂商和连锁零售商的智能化需求，为开发者提供一站式人工智能物联网PaaS级解决方案。业务涵盖硬件开发工具、全球云、智慧商业平台开发三方面，提供从技术到营销渠道的全面生态赋能。

“我们每天处理的设备请求的次数是840亿次，请求高峰是150万次/秒，同时我们云端服务器的响应时间是小于10毫秒/次，作为一家AI+IoT公司，每天还会处理1.2亿次的AI语音交互数。”涂鸦云端开发部首席架构师陈亚焱表示，面对大量的请求数量，做到实时响应，是涂鸦最大的业务目标和挑战。

此外，涂鸦提供了一个全球化的IoT的平台，就要求其做到在全球范围内的高可用，但全球的数据中心搭建成本比较高，运维和维护也成为了新的难题。与此同时，快速增长的业务，也要求涂鸦必须做到实时的扩容——云端整个设备都是在10毫秒之内会响应请求，对网络链路、稳定性、SLA都有非常高的要求。

“之前使用x86，M5g的CPU数值大约在27%，去年8月份开始向做Graviton 2迁移，使用Graviton 2后，涂鸦的CPU占用率从之前的27%降到了12%，服务器单价降低了20%，整体的性价比提升了2.5倍。”在陈亚焱看来，Graviton 2的架构非常符合涂鸦连接层的架构，因为其连接层本身就有轻量级的进程，Graviton2每个CPU核心的设计和进程都是隔离运行的，并且Graviton2也提供了更大的缓存，为整个CPU其实获得了非常好的提升。