2022年11月ChatGPT横空出世又带动了一波AIGC的热潮。
紧接着,语言交互、AI生成摄影等应用频频出圈;“文心一言”、“通义千问”等互联网科技角逐AI大语言模型头条。AI创业似乎成为当今这个时代的“热搜词”,引起广泛地关注与讨论。
2023年7月6日,于上海召开第六届世界人工智能大会(WAIC)基本“座无虚席”。众多机构团队来此寻问合作。
能够感受到的是,自ChatGPT之后,中国不仅成为世界上人工智能领域发展最快的国家之一,还全面进入了应用层的探索与实践。
但是,英特尔中国区网络与边缘事业部首席技术官、英特尔高级首席AI工程师张宇博士从技术的角度来看,AI大语言模型的商业模式仍然处于摸索的阶段,虽然未来会是自动化机器学习的时代,但是碍于成本、数据与人力的限制,还有许多要突破的底层技术。
尤其是他在主题演讲中提到“当下的人工智能一半是人工,一半是智能。”时尤为印象深刻。
换句话来说,在人为理论指导基础还未脱离出来自动学习时,其中的AI设计还有待与实际业务场景的匹配。
AI的大环境一片向好,英特尔也有所准备的去把握AI时代的机遇与趋于发展的必要场景。
得益于政策的支持,国内企业全面向AI应用迈进。据天眼查数据显示:截至目前,人工智能相关企业近267.4万余家,2022年注册企业就达73.4万家;2023年一季度新增注册企业17万余家,与2022年同期相比,上涨6.8%。
市场规模决定了技术的来龙去脉,所以未来的AI发展,必然会依赖于底层技术的突破,如通讯、存储等。张宇表示:“这些底层技术正是英特尔正在努力发展的方向,包括人工智能、边缘到云的基础架构、无处不在的连接和传感技术等。”
也因此,AI产业所面临的是软件与硬件的创新。
以英特尔为例,它有面向边缘人工智能训练的软件Geti,可以帮助科学家快速标注数据,并从中找到合适的训练样本。
硬件方面,也在积极的应对资源调度统一API接口,同时也在考虑如何在异构平台上进行合理的分配负债,以确保可以进行人工智能的处理。
底层方面,英特尔采用了OneAPI的思路,它基于DPC++编程模式,利用OneAPI提供的优化库,在英特尔硬件平台上可以高效地调用底层资源。
上层调度方面王宇建议道:“不同的应用会有不同的算法模型和算力要求,目前英特尔主要推荐使用专门为大模型训练设计的Habana Gaudi 2。”
前端方面,英特尔表示要根据不同的场景进行不同的产品组合,其中推理方面,主要采用OpenVINO深度学习部署工具套件。它可以能够帮助开发人员专注于模型设计和训练。在训练完成后,则会将训练结果传递给OpenVINO进行硬件及平台的适配。
“现在大家讨论的大语言模型,结构基本相似。”王宇认为,当下的语言模型的差异,集中在数据与训练投入的差异。例如,语音助手的训练需要收集大量的语音输入和输出数据,以便让AI大模型能够识别不同的语音指令和回答问题,这也正是当今语音助手是否可以分辨方言与普通话的主要依据。其训练的数量在收集和筛选上,往往也需要人或自动化工具来识别,也是张宇提到的人工智能中人为指导为什么未能完全脱离自动化识别的原因。
而随着人工智能的应用落地,往往在纷繁复杂的现象背后,是对敏捷性、高效性的诉求。因此,人工智能发展的第二阶段应该是边缘训练阶段,只有可以将特定的问题以特定的方式解决掉,才能够实现有效的AI大模型训练。
写在最后:
许多人已经感受到到AI大语言模型是当代不可错过的历史机遇,未来每一个APP都可能会被AI重构,也将可能在数字化的推动下,重写产业的本质。不过,AI大语言模型的竞争,并非只有性能的竞争,也是各种技术之间的综合竞争。当然放大视野,也是产业链阶段的各种合作,同样的,这也是一场持续的、巨大的投资决策。到底哪些公司有决心一直投入下去,这场浪潮究竟可以持续多久,还很难判断。