作者|史慧芳
(资料图片仅供参考)
编辑|六耳
来源|创头条
2023年亚布力论坛夏季高峰会于8月24日-27日在深圳召开,科大讯飞创始人、董事长刘庆峰出席并演讲。
刘庆峰表示,中国人工智能算法已经不受制于国外,算力方面也有好消息,“华为的GPU能力现在已经跟英伟达一样”。
-1-
“华为GPU已与英伟达A100相当”
据刘庆峰介绍,华为的GPU技术现在已经与英伟达A100相当,但由于算子库不全,因此整体效率与英伟达相比仍存在差距。但任正非非常重视这个问题。“华为的三位董事作为联系工作组到科大讯飞,我们成立了一个专班工作,目前已经可以媲美英伟达A100,这是非常了不起的。” 刘庆峰称。
“以前百模大战,基本都是由英伟达训练的。企业内部只能进行微小的调优和训练,而基本的训练模型是比较困难的。”刘庆峰表示,这次基本上解决了这个问题。
据了解,华为这款已经与英伟达A100旗鼓相当的GPU产品应该与昇腾910相关。
大模型的研发过程,需要可以支撑千亿参数规模大模型并行训练的算力和框架,还需要几千张芯片同时连续运行。基于此,系统架构以及并行训练的集群能力成为大模型研发的关键。
今年8月15日,在星火认知大模型发布会上刘庆峰表示,科大讯飞与华为共同发布一款用于企业构建专属大模型的软硬件一体化设备“星火一体机”,让所有企业都可以在国产自主创新的平台上自主、安全、可控地私有化部署大模型。
据刘庆峰介绍:“星火一体机可用于大模型的训练和推理,企业拎回去,开箱即可用。每一家企业,每一个行业、每一个学校、每个医院都可以有机会构建自己的专属大模型。”
据第一财经报道,星火一体机使用的是华为尚未官方对外发布的昇腾910B人工智能芯片。
一位业内人士在接受采访时称,“华为昇腾910B芯片的性能从未对外公布,但最近华为在业内大力推广这一平台,而且它的性能与上一代的910相比,应该绝对不是一个量级。”
据了解,星火一体机也是910B芯片首个对外商业化应用产品。
此外,科大讯飞和华为已在联合攻关算力卡脖子的问题。
刘庆峰在发布会上表示,正在与华为打造面向超大规模参数大模型训练的国产算力的集群,对标英伟达的A100芯片。A100是目前在大模型训练市场上应用最广泛的芯片。
刘庆峰表示:“华为与科大讯飞将共同在生成式软硬件平台上,把高算力、高性能的算子库,多卡的高速互联以及分布式存储结合起来,尤其是联合针对人工智能所需要的最重要的算子库进行甄别和打磨,在此基础上架构科大讯飞的训练和数据闭环的全流程设计,以及训练和推理一体化设计的自研的大模型训练平台。”
早在今年7月,科大讯飞就与华为宣布,打造基于中国自主创新的通用智能新底座。一方面,讯飞星火认知大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;另一方面,以昇腾AI为核心,软硬件协同优化,构建算力集中、性能优越、供给稳定、数据安全的大模型训练集群。
-2-
高端GPU亟需国产替代
国产大模型已形成群模乱舞、百模大战的局面。
大模型的发展需要算法、算力、数据三大重要因素的支撑,算力是大模型训练的重要能量引擎,也是目前国内发展大模型产业的一大壁垒。
正所谓“无芯片,不AI”。芯片能力直接影响着高算力训练效果和速度。
当前大模型浪潮风起云涌,大模型的算力需求飙升,AI芯片迎来了重要商机。
作为目前全球人工智能算力最大“军火商”,英伟达在高性能GPU方面的技术领先地位。
为了支持大型语言模型推理,英伟达发布了一系列围绕AI领域的产品和服务,其旗下的A100、H100、A800和 H800等高性能GPU芯片成为抢手货,一“芯”难求,且价格一路飙升。
尽管国产大模型产品频出,但从其背后支持的芯片来看,所有这些平台使用的要么是英伟达 A100、H100 GPU,要么是去年禁令后英伟达专门推出的减配版 A800、H800。
“国内大模型企业基本上很难拿得到这些芯片。整个市场需大于求,缺货非常厉害。”某电子元器件采购供应商坦言:“今年,这类GPU芯片从原来的12万人民币左右,变成了现在是25万甚至30万,甚至有高达50万一片”。
如今国内头部科技企业在AI和云计算方面投入较大。与此同时,中国科技大厂还在进行新一轮的采购竞争。
前不久,有报道称,国内各互联网大公司也纷纷向英伟达下大单,百度、阿里、字节等向英伟达订购了数十亿美元的GPU。
从大模型产品芯片供应情况来看,在AI大模型训练上,现在A100、H100及其特供中国的减配版A800、H800找不到替代品。
在如此疯炒以及中国大科技公司对于采购GPU非常急迫之下,中国急需中国版的“英伟达”出现,打破“缺芯”局面,实现国产替代。
.END.
图片来源|网络