2025年4月7日,亚马逊云科技日前宣布,Meta的新一代Llama 4模型现已在Amazon SageMaker JumpStart上正式可用,完全托管的无服务器版本也将很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B与Llama 4 Maverick 17B均具备先进的多模态能力(可同时理解图像与文本),并拥有行业领先的上下文窗口长度(单次处理信息量),性能与效率较前代显著提升。此外,Llama 4模型采用智能计算策略,根据具体任务智能选择激活其“专家”模块,而非全程调用全部算力,从而能以更低算力实现更优效果,降低企业使用先进AI技术的使用门槛与成本。
亚马逊云科技推出Llama 4 Scout与Llama 4 Maverick,进一步丰富了客户在亚马逊云科技上构建、部署和扩展应用程序时的模型选择。亚马逊云科技始终通过与如Meta等领先的AI公司紧密合作,确保客户能在第一时间使用最新模型,并借助企业级的工具与安全保障更轻松地构建、定制和扩展其生成式AI应用。
亚马逊云科技此次通过引入Meta两款全新的多模态模型,进一步强化了其对模型多样化的承诺。Llama 4 Scout 17B大幅扩展了AI单次处理能力——其上下文长度从早期Llama模型的12.8万token跃升至1,000万token(约提升80倍)。这一升级可支持多文档总结、复杂用户行为分析或整段代码库推理等场景。Llama 4 Maverick 17B是通用型模型,擅长12种语言的图文理解任务,尤其适用于开发复杂的智能助手与聊天应用程序。
两款Llama 4模型均采用原生多模态设计,即从设计之初就能无缝的同时理解文本与图像,而非将两者作为独立的输入进行处理。这是Meta首次采用高效的专家混合(MoE)架构,该架构仅针对每项任务激活模型中最相关的模块,能够帮助客户显著提升模型的训练与推理的计算效率,进而以更低的成本获得更出色的性能。
Llama 4 Scout 17B与Llama 4 Maverick 17B介绍
若将Llama 4模型拟人化,Scout就像一位注重细节的研究助理,拥有“过目不忘”的能力。假若身处大型图书馆中,它能够仅凭一张小小的书桌,瞬间能从数千份文档里精准调取所需信息。Scout能预判信息需求,不仅提供答案,还会赋予答案有意义的上下文。Maverick则像一位精通多语言的创意总监,擅长视觉叙事,无论是起草引人入胜的故事、精准分析复杂图像,还是在客户会议中用多种语言保持品牌声调,均能游刃有余。
数据解析
- 据Meta称,Llama 4 Scout 17B包含170亿活跃参数与1,090亿总参数,其性能在同类别模型中处于领先水平。
- Llama 4 Scout 17B还拥有行业领先的1,000万token上下文窗口——约为Llama 3的8万token的80倍。这相当于从一次性吸收几页书的信息跃升至整部百科全书。
- Llama 4 Maverick 17B包含170亿活跃参数与4,000亿总参数,分布于128个专家模块中。这如同拥有128台协同工作的专用机器,但仅按任务激活最相关的部分,兼具强大性能与效率。
模型的专家混合(MoE)架构就像拥有一支专家团队,而非一名通才。模型不会为每个问题调用全部算力,而是根据具体任务智能选择激活其“专家”模块。这类似于医院将患者分诊至不同专科医生,而非让每位医生尝试治疗所有病症。这种更具针对性的方式使Llama 4能以更少计算资源实现更强大的结果,让各类规模的企业都能更便捷、经济地使用先进AI技术。对开发者而言,这意味着他们能够构建复杂的应用程序,这些程序可以处理海量信息,同时支持多种语言,并能无缝处理文本和图像。
亚马逊云科技始终致力于为客户及时提供领先AI公司最新模型,随着模型在规模与模态上的持续扩展,这将赋能客户充分释放生成式AI的潜力。此外,亚马逊云科技很快还将在Amazon Bedrock中推出完全托管的无服务器版本的Llama 4模型。