华为挺进万亿AI计算产业 ?

2021-11-19 21:04 来源:

打印 放大 缩小

  文/李正豪

  基于自研AI芯片,华为不断扩大自己在AI计算领域的竞争优势。

  9月18日,在2019年全连接大会上,基于前不久推出的昇腾910 AI处理器,华为推出了AI训练卡Atlas 300、训练AI服务器的Atlas 800,以及由上千颗昇腾910 AI处理器组成的Atlas 900 AI训练集群。尤其是Atlas 900 AI训练集群,算力惊人。官方数据显示,该集群的总算力相当于50万台PC。

  ResNet-50模型训练被视为全球衡量AI计算能力的主要标准。华为轮值董事长胡厚崑告诉《中国经营报(博客,微博)》记者,在最典型的ResNet v1.5训练模型中,Atlas 900用59.8秒完成了训练,排名世界第一,让原来的世界纪录提升了10秒。

  “ImageNet-1K数据集”包含128万张图片、精度为75.9%,在同等精度下其他两家业界主流厂商的测试成绩为70.2秒和76.8秒,Atlas 900 AI训练集群的成绩比第二名快了15%。

  在2018年全连接大会上,华为首次对外发布AI战略,当时只交付了可用于推理计算的昇腾310处理器和ModelArts应用平台。一年之后,华为先是于2019年8月23日推出当前全球算力最强的AI处理器昇腾910,接着又在9月18日推出Atlas 900 AI训练集群,从芯片硬核上搭建起了全栈全场景的AI计算能力。

  发力AI计算产业的原因在于,华为预计,5年之后AI计算所消耗的算力将占到全社会算力消耗总量的80%以上,全球计算产业将进入新的智能时代。而Gartner的预测显示,到2023年,全球计算产业的规模将超过2万亿美元。

  算力稀缺的挑战

  众所周知,驱动AI发展的动力有三个要素:算法、数据、算力。其中,算法是否有创新发展难以量化跟踪,数据的巨大体量也难以计算,唯有算力可以量化。

  业界甚至有言论认为,AI让摩尔定律起死回生,就是因为算力的强大作用。可以说,算力是AI发展的重要基石,因为重要的AI技术突破依然必须在足够的算力基础上才能实现。

  而随着大数据、人工智能等新技术的应用,企业对于算力的需求不断飙升,传统计算产业亟待转型升级。统计数据显示,目前全球每年新增数据20ZB,AI算力需求每3.5个月就会翻一倍;该速度已远超摩尔定律关于性能翻倍的周期。按照摩尔定律,集成电路上可容纳的元器件数目大约每隔18~24个月便会增加一倍,性能也将提升一倍。也就是说,摩尔定律驱动的传统计算产业,已不适应大数据、人工智能的发展需求。另外,5G、物联网、边缘计算等新技术的崛起,也让算力面临更加多样化的现实需求。

  正因为此,尽管如今算法效率不断提高、芯片技术高度发达,但依然面临着算力稀缺的挑战。OpenAI近期发布的研究报告显示,2012年至2018年,人们对于算力的需求平均每年增长10倍。尤其是进入5G时代,数据量将以爆炸式的情形增长,因为AI行业需要对数据进行更大规模的清洗、标注、训练。这意味着行业需要更长的时间进行运算,而算力不够将会导致AI发展速度的降低。

  这也正是8月23日昇腾910发布时,华为另一位轮值董事长徐直军直言“AI研究遇到的最大困难就是缺少算力——AI本质就是暴力计算”的原因所在。

  很多巨头公司和创业公司都看上了AI 芯片领域广阔的市场前景。因为根据Gartner的研究,AI芯片在2017年的全球市场规模为48亿美元,2020年预计将达到146亿美元,其中云端AI有望占到105亿美元。但问题在于,就产品而言,目前真正有市场优势的厂商凤毛麟角。

  强悍的昇腾910

  放眼全球AI芯片市场,当前华为昇腾910的优势较为明显,这主要体现在以下几个方面:

  首先是生产工艺,昇腾910是一颗采用7nm+ EUV工艺技术的芯片,在工艺制造上属于当前全球最高水平。其次是芯片架构,昇腾910采用华为“Da Vinci(达芬奇)”架构。这属于华为自研架构,也是亮点之一。

  再次是开源架构,昇腾910采用MindSpore架构,按照华为的说法,该架构将于2020年第一季度开源。MindSpore架构对标当前全球主流AI 框架Tensorflow 、Caffe、Pytorch等,华为并开源这一架构有助于业界开发更好的AI应用,并促进AI生态的发展。

  最重要的一点在于,昇腾910是当前更强的AI芯片。其AI算力水平相当50个当前最新最强的CPU。其训练速度也提升了50%~100%。实测结果表明,在算力方面,昇腾910完全达到其设计规格——即半精度(FP16)算力达到256Tera-FLOPS,整数精度(INT8)算力达到512Tera-OPS。更为重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。

  正是基于上述性能指标,徐直军才敢在发布会上表示:昇腾910的总体技术表现超出预期,作为算力最强AI处理器当之无愧。

  昇腾910的横空出世更像是一个里程碑,作为全球已发布的单片算力最强的AI处理器,昇腾910恰恰是为AI应用而生。而基于昇腾芯片,华为面向人工智能应用和智能驾驶也分别推出了Atlas和MDC两个系列的产品,以推动普惠AI的目标落地。

  其中,基于昇腾910和去年华为全连接大会推出的昇腾310,华为已搭建了全栈全场景的产品能力。华为智能计算业务部总裁马海旭告诉记者,基于昇腾芯片的Atlas 200系列可以内嵌在智能机器人等产品;Atlas 300系列真要用于AI训练;Atlas 500系列用于边缘计算的小站;Atlas 800系列是针对AI服务器的;Atlas 900系列也是针对AI训练的。而在搭建超强算力核心竞争力的布局中,华为不仅仅有昇腾芯片针对AI计算,还有鲲鹏芯片针对通用计算,“昇腾+鲲鹏”在底层硬核方面构成了华为在整个计算产业的核心能力。

  相比较昇腾系列主打AI计算不同,华为鲲鹏920芯片主打通用计算,基于鲲鹏处理器打造的TaiShan服务器,其优势主要体现在高性能、低功耗上。这样一来就可以帮助企业更好进行大数据的即时处理和计算,从而为未来走向智能时代奠定基础。

  基于外界对华为推进AI全栈全场景战略的预测,“服务器操作系统”何时推出也颇让人期待。在2019年全连接大会上,华为宣布将于今年底开源服务器操作系统EulerOS以及单机版的GaussDB数据库,以“硬件开放+软件开源”姿态为计算产业向前发展注入新的活力。

  差异化的市场路径

  徐直军在介绍昇腾芯片商业模式时曾经指出,“我们不直接向第三方提供芯片,而是提供基于芯片的硬件和云服务,我们和纯芯片厂商没有直接竞争。”

  那么,消费者和企业如何才能用上华为的AI算力?事实上,全球市场中的各类AI芯片,基本上都是以板卡、服务器或云服务的方式提供给客户和合作伙伴的。华为也是如此。

  华为公司智能计算产品线相关负责人介绍说:华为昇腾系列AI处理器将搭载于Atlas系列AI产品和云服务上,并随之推向市场。

  前述Atlas 200、300、500、800、900系列产品都是基于昇腾AI处理器的系列人工智能计算产品,产品形态包括AI模块、加速板卡、边缘设备、服务器等,可分别应用于终端、边缘计算、云,覆盖全场景AI需求,让智能计算无所不及。目前,已有大量国内外企业搭载了华为Atlas系列模块和板卡,进行AI产品的开发。

  据了解,Atlas人工智能计算平台支持业界主流AI计算框架,如谷歌的TensorFlow、Facebook的PyTorch/Caffe等,也支持华为最新的AI计算框架MindSpore。其中,MindSpore框架的特点是可以实现算法即代码,大幅降低AI开发门槛,同时也具备全场景应用优势,其与昇腾910的深度协同将全面发挥处理器的算力潜能。

  目前全球范围内与昇腾910芯片相近的产品,主要由两家企业提供,一家是谷歌,另一家是英伟达。其中,谷歌只对外提供云服务,不提供板卡等。

  与纯芯片厂商英伟达相比,华为不独立出售芯片,而是出售搭载了自研AI芯片的Atlas系列产品,与之形成差异化竞争。

  与同样同时拥有AI芯片及云服务的谷歌相比,华为昇腾910的商业模式也存在差异化优势。因为“昇腾系列产品包括AI芯片和AI IP,其中Nano、TINY、Lite系列都是IP,既能嵌入华为自身芯片,也能嵌入其他所有需要AI能力的产品”。

  基于华为昇腾系列AI芯片,通过模块、板卡、小站、一体机等丰富的产品形态,华为打造了面向“端、边、云”的全场景AI基础设施,可广泛用于智慧城市、运营商、金融、互联网、电力等领域。

  华为发布的《全球产业展望GIV 2025》预测,到2025年,大企业AI普及率将达到86%。因此,华为开始在计算领域全面发力,并致力用芯片、AI和架构创新等技术,为客户提供强劲算力、云边协同、全场景覆盖、一体化的计算解决方案。

本文首发于微信公众号:中国经营报。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

责任编辑:互联网