导语:没有人能否认,科技正在成为现在以及未来整个人类社会发展的最新动能:我们看到的无论是物联网、人工智能、机器学习、云计算……数据和信息的价值被彻底释放出来,各种不断刷新和改变现有规则的新生事物,都源自科学技术的不断推动。而做为这一切的基础,芯片行业的每一次微小的进步,都有可能对整个IT行业、甚至整个人类社会带来不小的改变。
在芯片行业的江湖中,即便你不了解ARM这家公司和它们的产品,但是笔者可以肯定的是:你一定是ARM的用户。
高通、三星、NVIDIA、苹果、联发科、德州仪器……这一系列耀眼的名单都是ARM的客户。本身只做设计,不做制造、不销售任何芯片,通过将IP技术授权给厂商,ARM使得目前市场上超过95%的智能手机采用来自ARM设计的芯片方案,包括CPU和GPU。仅从2013年至今,全球范围内基于ARM架构或取得相关授权的芯片,就达到500亿片。
“即便是自2009年以来,ARM在移动端CPU的性能已经提升了100倍,也依然要时刻面对技术、市场和用户越来越高的要求。”Nandan Nayampally,ARM副总裁暨计算产品事业部总经理,在2017年3月21日发布DynamIQ技术时谈到,随着智能移动终端的大量应用,尤其是在物联网所强调的“万物互联”的引导下,来自移动端对数据处理和计算能力的要求越来越高,因此对芯片性能的要求也越来越高。
面对无所不在的计算需求,Nandan Nayampally认为:“DynamIQ是针对下一个计算时代应运而生的新技术,是未来ARM Cortex-A系列处理器的基础。”
做为一个技术先导型企业,12年前,ARM推出了革新式的多核ARM11,第一次实现了在单一群集支持四核用于嵌入式的系统,使得内部配置做到多元化、灵活性;6年前,ARM big.LITTLE技术实现异构计算的多核。而ARM此次推出的DynamIQ技术,是对2011年推出的ARM big.LITTLE技术的演进——延续了“根据不同的任务选择最合适的处理器”的思考方式,DynamIQ更强调能够在单一群集中最多部署8个核,且每个核都可以有各自不同的性能特征,而这,使得对于芯片群集的可配置性又被大大推进了一步。
从应用层面讲,DynamIQ的应用场景被定义为:覆盖从端到云的安全、通用平台,将被广泛应用于汽车、家庭以及数不胜数的各种互联设备。进而,帮助这些设备所产生的以泽字节为计算单位的数据,在云端或者设备端被用于机器学习,从而实现人工智能的应用。
Nandan Nayampally也从应用层面强调了DynamIQ对于加速人工智能在各个领域应用普及的价值和作用。他认为:从技术层面讲,目前针对人工智能的算法和应用场景个不相同,而且市场上针对人工智能算法的加速模块种类也非常多,但归根到底,对于推进人工智能技术在各个领域走向深入应用的基础,还是在于CPU和片上系统部分。
而此次推出的DynamIQ,采用ARMv8.2版本指令集,其中包含有专门针对人工智能工作负载的指令集,以及相应的优化库。而专门的AI工作负载,可能有50倍性能的提升。这也就意味着DynamIQ能够实现人工智能工作负载在CPU各个核上的部署和分配更加高效。
同时,针对人工智能多元化的实施和运营,DynamIQ提供了专门针对这些AI的加速模块接口,从而使得来自用户端的响应速度可以更快。“我们预计,最新一代解决方案可实现比基于Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。”Nandan Nayampally强调,DynamIQ一方面能够实现通用处理器在AI性能方面的提升,另外一方面,能够实现通用的处理器和专门加速模块之间快速的响应和连接。所以,整个片上系统本身针对AI的性能就能够得到提升。“尤其是针对一些本身体积受限的小设备而言,这一点是非常重要的。”
采访的最后,Nandan Nayampally说:ARM有这样的一个传统,2017年发布一个新的技术,那么第二年就会在设备端得到使用;我们的另一个传统是,每一个新的技术一般来说都是率先被用在智能手机的领域,然后是被应用在汽车领域和其他嵌入式系统。
“不过相对而言,我认为企业级市场在DynamIQ技术的使用上也会更快一些。” Nandan Nayampally说。