在过去6-8个月的时间里,我们看到生成式AI正在迅速引爆每个行业——写作、设计、编码、建模、搜索甚至是决策……在技术进步与其所能实现价值间实现了融合。随着数据爆炸、高度可扩展的计算能力的可用性,以及机器学习技术的不断进步,生成式AI登上了舞台。
值得一提的是,亚马逊云科技在为客户提供广泛的机器学习能力方面有着悠久的历史,过去10年间提供每一个级别的机器学习能力,包括底层芯片、Amazon SageMaker机器学习服务和开箱即用的AI服务。
“就像在云计算时代,亚马逊云科技提供通过API访问云上应用的快捷访问,这一愿景不会因为生成式AI的出现而改变,我们仍然希望将这项技术交到每一个构建者和每一个商业用户的手中。”亚马逊云科技全球产品副总裁Matt Wood在接受笔者采访时这样说到。
亚马逊云科技全球产品副总裁Matt Wood
那么,如何解锁生成式AI的价值呢?
首先,要提供对一流的基础模型的访问,以便可以构建最好的生成式AI应用程序。事实上,很难通过一个单一的模型包办一切,客户更希望通过多种不同模型与自己的应用整合,从而实现业务的创新。
Amazon Bedrock可以提供对一流的基础模型的访问。这项新服务允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊的基础模型。Amazon Bedrock 是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,为所有开发者降低使用门槛。在 Amazon Bedrock上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型。
“客户可以对自己的私有数据做定制化的基础模型,只需将数据放在Amazon S3里面做标记,告诉Amazon Bedrock它的位置,并提供正确的权限,Amazon Bedrock就可以自动完成余下任务。”Matt Wood强调,亚马逊云科技不会把Amazon Bedrock做成类似应用市场的模型市场,会更加关注一些有趣、有用的模型,并确保它们是低时延,同时具有广泛可用的运维性能,这将是一种变革性的方式。
其次,需要提供安全私密的环境去定制模型。当客户使用大型语言模型时,必须非常清楚数据在使用时的去向,避免意外地泄露。
Amazon Titan模型库和第三方基础模型,在安全和私密的环境下实现优化和微调:Amazon Titan是一系列不同的模型的库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调。
再次,需要通过定制芯片提供低成本和低延迟访问。无论是专用生成式AI的机器学习芯片,还是Inferentia,亚马逊云科技的Inf实例能够去实现低延迟,同时Trainium芯片能够帮助大家去更好地训练模型。网络优化型 Trn1n 实例专为大型网络密集型模型设计,其性能比 Trn1 高出 20%。
最后,需要搜寻机会提升使用体验。Amazon CodeWhisperer是亚马逊云科技基于机器学习为开发人员提供的一个代码生成的服务,支持包括Java、JavaScript和Python等在内的15种不同的编程语言,个人用户可免费使用。在测试中,与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。
“如果把所有这些放在一起——机器学习的创新、定制化的芯片以及利用Amazon Bedrock使用模型,你会发现‘从未有过如此简单、低成本的,借助机器学习进行代码构建的方式’” Matt Wood透露,亚马逊云科技曾找了内部技术部门的一位产品经理,他不是任何形式的开发人员,让他去做一个个人理财的APP,以提供一套个人理财方案,借助Amazon Bedrock眨眼间就实现了,在归纳总结方面效果非常好,最重要的是,完全不需要写代码。
也就是说,亚马逊云科技正在通过自己的产品矩阵,帮助企业客户打通一条从底层架构到最终应用落地的生成式AI框架:在大模型的基础之上,确保以私密和安全的方式让用户能够定制自己的模型。同时积极地采用第三方提供的生成式AI的模型,比如,Anthropic、AI21Labs和Stability AI,又或者是亚马逊自研的预训练的Amazon Titan基础模型,客户可以根据自身需求,使用自己的数据,进行专业化或者专门化模型的构建。
另一方面,数据对于生成式AI而言更是所有一切的起点。对此,亚马逊云科技的做法是:云原生数据战略。对于客户而言,他们的需求也更加透明:全面的工具集,满足现在和未来的需要;能够轻松集成,连接所有数据;同时通过端到端的数据治理,解放团队,更快处理数据。
目前,亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;亚马逊云科技的分析服务已全面实现Serverless化。
此外,亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。Amazon Aurora可以与Amazon Redshift进行Zero-ETL集成,允许使用 Amazon Redshift 对来自Aurora的PB级事务数据进行近实时分析和机器学习 (ML)。
构建端到端的数据治理方面,亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。
Matt Wood对于使用数据开启生成式AI旅程提出了五条建议:基于自己现有的数据战略去做构建;在组织内实现更广泛、更安全的生成式AI实验;为需求场景定制化模型;携手亚马逊云科技,探索无限可能;选择场景,即刻启程,构建未来。
“生成式AI的发展就像一场马拉松比赛,这是一场长期的竞争,是一场长跑。”Matt Wood认为,当接近终点的时候,每个人都会看到亚马逊云科技能够为客户在生成式AI应用程序构建方面提供最简单、最经济以及最安全的服务。