过去几年,我们谈大数据、人工智能和机器学习等新兴技术该如何赋能企业的企业发展,如今来看很多的构想已经遍地开花结果……这一切的发生,离不开云计算大大助力激增的数据和大规模可用的计算资源的实现,以此一直推动人工智能技术不断地创新。在过去不到一年的时间里,生成式AI应用场景井喷,这预示着一个新的转折点,一个新的技术时代。
当前,生成式AI已经应用到企业创新的各个环节:智能客服优化客户体验、自动生成代码提高技术团队生产力、文字生成图片加速创意内容生成以及自动化文档处理提高整个组织的运营效率……可以说,生成式AI真正让AI在企业加速落地。
“我们很久没有看到一个技术,在各行各业同时遍地应用。”亚马逊云科技大中华区解决方案架构部总监代闻日前在亚马逊云科技re:Inforce2023中国站的主题演讲表示,生成式AI的需求越来越多从业务部门提出,不只是技术部门进行创新的工具或者是平台,而是变成了业务增强竞争力的一个核心手段。这将大大加速各个行业智能化的发展,也将促进改变行业游戏规则机会的出现。
亚马逊云科技大中华区解决方案架构部总监代闻
不过,也正是因为生成式AI应用场景的井喷,业务部门需求如此旺盛,给企业的技术部门带来了前所未有的挑战。以数据泄露为例,某国际企业在采用了某一个流行的基于大语言模型的公开聊天应用服务后,20天时间里出现了3起数据泄露事件。这不得不让整个已经“热到滚烫”的AI行业冷静下来——面对诸多的安全隐患,我们应该怎么做。
“从构建开始,我们就需要把安全作为企业AI战略发展中的核心环节。然而,我们应该从哪里开始?依靠一个什么样的框架?这就要求我们不能只是关注 AI 应用本身,而是从一个全栈的角度,去全面审视 应用、模型、数据、基础架构的安全规范、技术策略和平台工具。”代闻将生成式AI应用比喻为海面上的冰山,想要在企业里安全地驾驭这项新技术,还需要关注海面下的冰川。
这首先要从最核心的数据谈起,数据和模型安全是构建AI应用的关键。
众所周知,生成式AI的井喷对企业的数据平台有了更高的要求:要训练构建一个生成式AI的模型,需要大量的非结构化数据;如果企业直接应用做好的模型进行微调,这时候又需要有高质量的专业化的数据。这两个方面的对于大多数企业的数据平台都是提出了更高的要求。
“亚马逊云科技提供了贯穿生成式AI全周期的数据治理,从数据源的获取到数据的存储和查询,再到将数据传输给 AI平台进行模型的训练、调优和推理,以及全面实施数据分类和治理。“代闻表示,亚马逊云科技提供了一整套的解决方案、产品服务和最佳实践,帮助企业加速落地端到端的云原生数据战略,给生成式AI 提供高质量的数据支持。
例如,亚马逊云科技通过实施安全密钥管理、静态数据加密、强制实施访问控制、利用机制限制数据访问,保护存储中的数据。
针对高质量的数据,亚马逊云科技有两个保护重点:防止数据泄漏以及防止数据篡改。在本次大会上,亚马逊云科技推出了敏感数据保护解决方案,可实现对企业敏感数据的自动化发现并在统一平台管理数据资产。该解决方案允许客户创建数据目录、使用内置或定制数据识别规则定义敏感数据类型,该方案利用机器学习、模式匹配的方式自动识别敏感数据,并提供可视化面板,帮助客户更轻松地对敏感数据进行管理和保护。
在数据传输过程中的保护方面,亚马逊云科技从实施安全密钥和证书管理、执行传输中加密、自动检测意外数据访问、对网络通信进行身份验证四个方面对传输中的数据进行保护。多层次保护传输中的数据。亚马逊云科技通过跨区域之间的数据传输、VPC内部以及VPC之间的传输、迁移上云的过程中、以及TLS1.2+AES256从整个的基础架构上实现应用层的加密和传输的保护。
“实现这些功能的基础是亚马逊为全球数百万活跃客户提供安全身份认证和合规服务的经验。”代闻强调,亚马逊云科技已经在245个国家和地区提供服务,目前的区域有32个,102个可用区,强大的基础设施可以提供无论是区域内、跨区域连接,还是应用层方面的防护。这些宝贵的经验也是大家如今享有唾手可得功能的基础。
在数据使用的过程中,亚马逊云科技则是通过身份认证、隔离环境、多方协作以及数据共享四个方面,进行使用中的数据保护。
这就不得不提到亚马逊云科技的基础运算平台Amazon Nitro,在过去的10年里Amazon Nitro支撑起了整个运算环境的安全可靠,那么在新的AI时代背景下,它又会发挥怎样的价值?
其实Amazon Nitro发展的过程就是不断使用硬件来加速虚拟化,同时加强安全的过程。2017年Amazon Nitro第三代,亚马逊云科技把整个虚拟化层硬件化,放在Amazon Nitro的平台,以此实现真正在宿主机软件层面上没有任何的攻击面。此后,Amazon 推出了出了Amazon Nitro Enclaves,做隔离运算的环境,在运算的环境中,看不到运行空间里面的任何的信息。2022年亚马逊云科技又发布了Amazon NitroTPM,用来增强对可信计算的支持。
“Amazon Nitro整个的安全特性是深藏于整个虚拟化平台的底部,现在Amazon Nitro的技术已经应用到了所有亚马逊云科技的服务里,并不是只给Amazon EC2。”代闻表示,Amazon Nitro提供了本地存储实例加密到裸金属以及实例间的加密传输的完整支持,这也是最近10年业界硬件虚拟化提升性能、提升安全的一个缩影。
谈完数据,接下来就是模型的安全。大模型其实是把非常多的数据训练生成了一个大的应用程序,因此针对模型的访问策略就非常地关键。不过,模型的访问策略不是静态、一次性的,而是需要通过设置验证调优不断迭代的过程,这样才能保证访问控制的策略是与时俱进起作用的。
针对大模型,几个月前,亚马逊云科技宣布推出Amazon Bedrock和多种生成式AI服务和功能,以帮助客户构建和扩展自己的生成式AI应用程序。Amazon Bedrock提供了广泛的基础模型因此客户可以选择最能满足需求的模型。
具体来看,Amazon Bedrock后面接入了基础模型,它给提供了一个API可以使用大模型加速生成式AI的应用程序和开发,无须管理底层的基础设施;Amazon Bedrock会负责任地选取一些合作伙伴,例如AI21 Labs、Anthropic、Stability AI,以及自己的基础模型,另外最新推出的合作伙伴名单里也增加了Cohere,便于客户最快速地找到最合适的、能力最强的基础模型;企业使用组织内部的数据来训练大模型时,Amazon Bedrock不会拿任何用户的数据来增进自己的模型;它能全面地使用亚马逊云科技提供的安全功能,Amazon KMS、Amazon IAM等可以完善地跟Amazon Bedrock集成,集成以后可以很好地管理加密、权限控制和所有行为的日志。
“当然,亚马逊云科技也会提供自己的大模型Amazon Titan给大家使用。Amazon Titan有两个基础模型:一个是Titan Text,能够执行文本类的任务;另外一个叫Titan Embeddings,执行个性化推荐的任务。”代闻表示,亚马逊云科技致力于开发公平且准确的人工智能和机器学习服务,并为企业客户提供负责任地构建人工智能和机器学习应用程序所需的工具和指导。亚马逊云科技在负责任AI方面有着坚定的承诺,如Amazon Titan可以通过减少和消除不当或者是有害的内容来支持负责任AI的实现。
从应用的角度来看,应用安全是实现AI价值的保障。安全应该贯穿到从开发到持续集成、持续部署再到投产、监控以及整个反馈的过程里面来。亚马逊云科技利用自身经验,将AI防护应用到软件开发的全生命周期,让开发更便捷,更安全。
Amazon CodeWhisperer是亚马逊云科技推出的AI编程助手,可根据开发者指令利用内嵌的基础模型实时生成代码建议,该服务内置了代码安全扫描功能,可帮助开发者查找难以检测的漏洞并提出补救建议。
Amazon CodeGuru Security可以扫描代码,在代码里面寻找漏洞,包括调用包漏洞,包括很多其他代码逻辑的漏洞。它还能够在CICD通过人工智能和机器学习的方式自动降低误报率,同时它基于API设计,能够非常方便地集成到开发工作流里边去,实现集中化和扩展性。
在应用的运行当中,我们看到的概念有零信任、安全威胁以及攻击保护等。其中零信任近几年常被作为新的技术提出,但是在亚马逊云科技看来,零信任不是一个标准的工具和解决方案,而是一个机制,它需要经过不断演练来达成。
亚马逊云科技的零信任体系包括身份认证、可信网络、以及高颗粒度的权限管理以及审计。代闻强调,零信任和网络控制并不是一个二选一的关系,零信任能够实现按需的授权和认证,而网络控制依然是非常需要的,把这两个概念应该加起来,才能够实现企业的端到端的应用安全,尤其在大模型的时代中。
写在最后
在全球环境下,安全合规变得越来越重要。目前已经有超过130多个国家和地区制定和颁布了数据保护和隐私安全相关的法律法规。同时由于云计算的大规模普及,越来越多的重要数据正在加速上云,而且数量和种类在增加。业务持续变化,给安全合规带来的挑战,这里边其实也包含诸如像大模型运用带来的业务的变化给安全带来的挑战。
“亚马逊云科技在全球获得140多个安全标准和合规认证,并将AI技术应用到其安全及合规服务中,能够为大规模批量审查提供安全控制,利用自动化减少手工操作以降低错误,利用AI提供一致性判断,AI/ML技术实现自动审查,全面提升合规效率。代闻透露,亚马逊云科技通过在其500多项自身合规审计控制项中使用AI技术,将审计时间节约了53%。同时,亚马逊云科技APN合作伙伴网络提供数百种行业领先的安全解决方案,多层保护客户的应用和数据安全,通过全球安全伙伴提供的解决方案,携手构建1+1>2的安全合作。