ChatGPT的横空出世,证明了大语言模型是一条走得通、通往未来AI的道路,也意味着AI的发展经过几十年的算法、算力、数据方面的量变积累,“质变时刻”已经到来。
就在各大IT巨头争相在各种大模型、生成式AI相关的产品和解决方案“并驱争先”的时候,IBM在5月份发布了企业级AI和数据平台watsonx;并从7月份开始,各个模块陆续上市。其中,watsonx.data的premise版本现在已经可以提供给中国客户。
IBM为什么会以前所未有的速度,推出watsonx 呢?在回答这个问题之前,我们需要了解当下企业领导最关心什么?IBM商业价值研究院,最近发布了一份面向全球超过30个国家和地区,超过3000名CEO的调研报告。调研报告显示:有四分之三的受访CEO认为,部署先进的生成式人工智能将为企业带来竞争优势。61%的CEO也表达了对生成式AI中所使用的数据来源的担忧。
从报告数据来看,“让AI成为核心生产力”成为了企业领导的迫切需求,而这个市场机遇给IBM在AI领域数十年的积累,更是提供了千载难逢的机会。不过企业对数据来源的安全担忧,也侧面反映了企业的AI之路面临着重重挑战。
“企业客户首先需要解决的是数据的准备、应用和治理带来的技术挑战,而实现这一目标的前提是,快速实现人员技能的转型和提升。当然,技能的转型往往伴随组织文化的更新,如何让二者互相成就、带来生产力的提高,这需要优秀的管理智慧。”IBM大中华区董事长、总经理陈旭东日前在IBM watsonx大中华区发布会表示,IBM对未来企业级AI的看法是:根据自身的业务需求、使用企业自己的数据,为他们量身定制生成式AI解决方案和模型。
值得一提的是,作为全球AI前沿技术和应用的重要参与者,IBM和AI的关系可追溯到上世纪五六十年代:从最早期的跳棋人机比赛,到90年代的国际象棋人机大战,再到2019年,人工智能辩手……挑战难度升级的背后,是IBM对于人工智能技术探索的“进阶”,并积累了丰富的实战应用经验。
2023年,随着ChatGPG的大火,企业对生成式AI和大语言模型的关注度激增,迫切希望应用AI领域的新技术来提升竞争力。而新一代数据与AI平台IBM watsonx可以说完美适配当前企业级AI的需求——IBM已经拥有业界最全面的基于传统的机器学习和新的基础模型的企业级 AI 产品组合,同时,watsonx发布之前的IBM Watson 套件, 经由IBM及其强大的生态系统,已部署到20多个行业的1亿用户当中。
“每当谈起人工智能的话题,我被问到最多的一个问题是:IBM现在还在做人工智能吗?现在我要告诉大家,IBM是一家混合云与AI公司。”IBM大中华区首席技术官、研发中心总经理谢东强调,IBM一直在做AI,专门为企业做,而且一直是这个领域的技术领先者和市场占有率领先的公司,通过推出不同的方案、方法来帮助客户取得成功。例如,IBM几十年来一直是很多重大体育赛事的技术赞助商:美国高尔夫球大师赛、英国温布尔登网球锦标赛、美国网球公开赛……让大家直观地去感受新技术带来的不一样的体验。
虽然人工智能应用的场景广泛且有趣,但具体的实施又谈何容易?大家可以设想一下,在体育实施转播的场景当中,虽然可以利用ChatGPT的某些功能,实现场景应用,但对于其他的特定场景,例如说赢率预测,ChatGPT多少略显单薄,绝对不够支撑整个应用的落地。
这就是现在很多企业面临的一个状态,已经发现很多基于大语言模型的应用越来越多,企业也想在自己的行业中用到这些人工智能的应用,但是在用的过程中会遇到很多的挑战:用哪个模型、如何用企业的数据以及如何用什么样的工具开发应用和部署等。
“IBM现在经常提到的一个词叫基础模型,我们认为在现在生成式人工智能的阶段,基础模型是最关键的一个概念,它超越了不光是大语言模型,在企业级应用的时候,除了大语言模型还会有不同的应用场景,包括IT的自动化模型、数字劳动力的模型、网络安全模型等,这些不同的专业模型才支撑了企业的应用。”谢东认为,基础模型从技术上跟以往基于深度学习、机器学习的算法很显著不同的一点在于:过去要对很多海量的数据进行打标签,这也就限制了其广泛应用的能力;基础模型不需要标签化,可以在海量的原始数据中学习,甚至直接去读企业内部的数据,客户的交易数据,客服的数据等,形成的模型可以在很广泛的领域里面生成不同的应用,给企业创造更多新的可能性。
此时,对于企业来说,拥有基础模型,有这么一个问题:到底什么样的模型才是企业真正需要的?大就意味着好吗?不完全是。因为当一个大模型很大的时候,虽然它的知识,它的能力非常强,但是成本巨大,对于企业来讲,对于专门的应用,不在于模型本身有多大,而是在于多大程度符合企业的特定要求,能不能很好地完成任务。
与此同时,支持一个大模型的运行非常耗算力,企业有足够的算力支来持这样的应用吗?可能没有。企业应用当中,目标是模型能够解决其特定的问题,再有就是运维成本上的考虑。也就是说,企业希望这个模型越小越好,越小越灵活,越小才更加节能更加有效,这才是站在企业的角度对一个企业人工智能的要求。
“企业有一个基础模型后,能够以它为基础,很快地演化出不同的应用,这就需要有新的工具、新的项目管理的自动化的方法来进行训练调试部署等工作,watsonx就是这样一个平台工具。”谢东表示,作为新一代数据与AI平台IBM watsonx主要有三个部分组成:watsonx.ai、watsonx.data以及watsonx.governance。它分别为用户提供了先进的机器学习、数据管理,和生成式AI功能,以快速、可信数据和治理的方式在整个企业中训练、验证、调整和部署AI系统。可以为整个数据与AI生命周期提供帮助,从数据准备到模型开发、部署和监控。
在IBM watsonx统一的平台之下,watsonx.ai、watsonx.data以及watsonx.governance可以通过无缝的协作能力,帮助企业实现在整个生命周期的业务扩展:无论是公有云,本地亦或者是混合云平台的数据,通过调用watsonx.data,建立数据的连接,即可轻松访问。通过识别数据的来源和ID,对数据进行分类,此时每个数据集都会获得一个数据名片,包含数据堆的名称和版本,以及其内容和已应用的过滤器等内容。它们共存于watsonx.data中,并且可以无缝地访问不同版本的数据以适应不同的目的。
模型训练阶段,可以从IBM提供的五个系列中选择一个模型架构,并从watsonx.data中选择一个目标数据堆的版本。watsonx.ai允许使用混合云环境的计算资源进行训练,也可以根据训练所需的计算资源进行调整。watson.ai的训练利用了最好的开源技术,以简化用户体验,建立在使用Pytorch和Ray的Codeflare上,并且还整合了hugging face,为客户提供丰富多样的开放格式。
模型验证阶段,通过运行一组全面的基准测试来评估模型在各种指标上的质量。一旦模型在所有基准测试中都达到阈值要求,就会被打包并标记为可以使用。
然后进入watsonx.governance,将数据名片与模型名片进行合并,一起形成一张事实表。通过微调刚刚创建的模型,将模型适应到新的下游任务,这就是基础模型带来大规模生产力提升的基础。
模型部署阶段是AI工作流程的最后一步,可以位于公共云、本地或边缘设备中。一旦模型部署,会持续监控并更新,包括watsonx.data和watsonx.ai。
“我们称这个持续过程为数据和模型的工厂。”在谢东看来,随着watsonx.governance监控着模型,如果有任何可能影响模型使用或性能的变化,进程会引导并处理对于数据和模型的更新。它对AI的稳健和适当的治理至关重要。
除了模型、平台,企业还需要算力的支撑。为此, IBM在云上建立了一个AI超级计算机Vela,它是一个超级GPU集群,可以帮助用户通过云的环境来训练自己的模型,在上面部署人工智能的应用。它还有一些独特的特性,直接用云上的高可靠的存储以及下面VPC虚拟私有云的模式,使得虽然在云上能够保证企业应用是高度可靠、高安全的。
事实上,在不到一年的时间里,企业已经从”应用AI助力业务经营”的范式,转变为各行各业几乎每家企业都在寻求如何把AI嵌入企业的战略核心——而将我们带到了这个拐点的正是基础模型技术。现在的企业希望把人工智能用到企业核心应用里面,增强实际的生产力,企业正在从以前数据为先的“+AI”时代迈入AI为先的“AI+”时代。
需要注意的是,企业在“+AI”时代,系统构建是以数据为中心的,通过在数据应用的层面上附加一些AI的能力,而“AI+”时代,考虑的是企业已经建立起来了人工智能的基础能力,并以此为基础,让它结合企业自己的数据和不同的业务目标构建起新的应用。在实施过程中,企业在开始阶段不断把一个小的现有的业务赋予了AI的能力,通过横向扩充,以及在不同的AI模型之间能够进行自动化串联,使得企业的运作越来越智能化、自动化。
而IBM的核心业务目标就是帮助企业建立起人工智能的基础能力。同时,围绕现在新一代生成式人工智能建立起企业级的应用,把人工智能的能力转化成业务价值。
当前,AI的“淘金热”正在迅速在各个行业发酵。无论是金融、医疗、教育还是制造,甚至是气候、编程和代码都已经开始广泛应用AI。
从行业的角度来看,watsonx的技术价值可谓是囊括整个IBM架构图:从基础架构大型机、小型机、存储;基础架构之上是基于红帽的IBM混合云平台。基于IBM搭建的AI构建,可以给企业用户提供不同业务场景的AI应用,包括数字劳动力、IT自动化、安全、可持续、应用现代化,同时具有企业基础架构和生成式AI的能力。
“IBM有一个很强的能力,就是AI专长和行业专长,这就是IBM咨询的能力。IBM有一大批具有咨询能力的人工智能专家,随时为客户提供转型服务。另外,IBM还有一个很强大的生态圈。这个统一的架构,是IBM帮助客户面对未来爆发性的AI技术提供的整体平台。”IBM 大中华区科技事业部总经理、中国区总经理缪可延透露,IBM的AI战略需要靠合作伙伴来落地,过往两年IBM实施了伙伴优先政策,这也让很多IBM的新老伙伴深刻感受到IBM渠道转型的决心。
首先,IBM下沉了很多客户到渠道。在中国区,除了18个客户之外,其他客户全部是渠道模式。
其次,发布全新的合作伙伴奖励计划:一方面,作为新的合作伙伴只要加入,首单就可以拿到奖励;另一方面,无论是新老伙伴,如果是新客户,都可以拿到额外的奖励。
最后,技术共创。IBM把资源全部免费开放给伙伴。
“ 过往2年我们一直在推在中国跟客户跟伙伴的三大共创平台——由IBM中国开发中心打造的‘IBM鲁班平台’、由IBM车库创新体验中心打造的创新工作坊、由IBM创新体验中心提供的共创服务平台。”IBM大中华区伙伴生态业务总经理谭颖瑜表示,依赖这三大共创平台,IBM制定了“鲁班创新精英伙伴计划”,并聚焦于三大场景:开放式湖仓一体、湖仓一体机以及借力IBM watsonx平台训练创造更多、更新的应用场景。
写在最后
从技术领先,到强调服务在其中的价值,IBM所谓的“共创”所体现的,实际上是对企业用户现实业务的极大尊重。而从目前整个IT产业看来,一个技术蓬勃发展的时期正在过去,而随之而来的,就是在应用环境,由用户的选择,来决定各种新兴技术的未来,是入局或者淘汰。
陈旭东强调,企业领导在采用基础模型和生成式AI的时候要考虑三点:如何利用AI产生竞争优势,同时实现跨行业使用AI,最后推进可信的AI技术。“实现这三点就需要一个从算力开始,自下而上的AI与数据平台,这就是为什么IBM要推出watsonx这样一个全栈式的AI与数据平台的核心价值。”
从市场反馈来看,更为明显的是,企业用户选择的依据更加简单直接——就是是否能真正作用于其现实的业务,能否带来计划中的价值和效益。从这一点上讲,IBM在技术的基础上,附加更多共创的服务价值,是对未来市场的一个更加积极的响应。