芯片战场丨最新5nmAI芯片Gaudi3登场 英特尔对垒英伟达

更新时间:2024-04-11 03:56:27作者:橙橘网

芯片战场丨最新5nmAI芯片Gaudi3登场 英特尔对垒英伟达

21世纪经济报道记者倪雨晴、实习生朱梓烨 深圳报道

AI算力市场的竞赛正在继续。

北京时间4月10日,英特尔在Intel Vision 2024大会上发布了最新一代AI芯片Gaudi3 ,和全新品牌的下一代至强6处理器等软硬件产品。其中,对标英伟达的Gaudi3最受关注,预计将于2024年第二季度面向OEM厂商出货,同时Sierra Forest架构的至强6处理器将在2024年第二季度推出。

在PC芯片方面, 英特尔将在2024年推出下一代酷睿Ultra处理器家族(代号LunarLake),将具备超过100 TOPS平台算力,以及在神经网络处理单元(NPU)上有超过46 TOPS的算力。新芯片瞄准下一代AI PC,英特尔预计将于2024年出货4000万台AI PC。

与此同时,互联网大厂也在加大自主研发芯片的力度。比如,谷歌在刚刚举行的云计算年度大会上推出了CPU产品Axion,这是一款基于Arm架构的服务器芯片。这也意味着,谷歌将和英伟达、英特尔、AMD三巨头都存在竞合关系,谷歌欲通过自研来满足自家业务需求、减少芯片成本。

一方面,当前正在上演AI芯片的大角逐;另一方面,虽然生成式AI应用越来越多,但是根据cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化,因此包括英特尔在内的芯片厂商们都在给出新的解决方案,来争夺这一市场。

IDC亚太区研究总监郭俊丽向21世纪经济报道记者表示:“生成式AI是narrowAI走向wideningAI的重要引擎,未来除了核心数据中心应用场景外,生成式AI还将进入更多领域,分布式AI将带来深远影响。”

Gaudi3上线 巨头争霸AI芯片

首先来看一下Gaudi3,该AI芯片采用台积电5纳米工艺,支持128GB HBMe2内存。英特尔表示,与上一代产品相比,Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。

和竞品比较来看,根据发布会的介绍,在AI模型算力中,相比于英伟达H100 GPU,Gaudi 3的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本低于H100。

在AI芯片领域,英特尔正在迅速发起攻势。从英特尔在人工智能芯片布局来看,目前主要有三类,分别是专门针对生成式AI而生的Gaudi系列,Xeon至强芯片系列、GPU产品线。

其中,Gaudi系列直接对标英伟达,欲争夺AI算力市场的宝座,上一代Gaudi 2芯片是采用7纳米制程。新一代的Gaudi 3继续提升制程和性能,在此之后,英特尔还规划了代号Falcon Shore的AI芯片。

英特尔CEO帕特·基辛格在会上表示,到2030年,半导体市场规模将达1万亿美元,而AI是其中的主要推动力。

而AI赛场上的竞争更加激烈。老对手AMD去年就推出了MI300系列产品,MI300X芯片拥有超过1500亿个晶体管,内存密度是英伟达H100的2.4倍,内存带宽是其1.6倍。TechInsights分析道,AMD正在系统层面实现人工智能加速,在推理工作负载上有一定优势,有望从英伟达手中获得市场份额。而2024年英伟达将推出下一代产品,肯定会超过AMD的产品,竞争将会加剧。

在今年3月,英伟达就刷新了产品线,发布了最新的GPU架构平台Blackwell,新一代的AI新品B200性能强劲,包含2080亿个晶体管。英伟达CEO黄仁勋表示,B200 GPU的AI运算性能在FP8及新的FP6上都可达20 petaflops,是前一代H100运算性能的2.5倍。

当前场上三强争霸,英伟达在巩固自身地位的同时,也面临另两家巨头的挑战。眼下,AI芯片市场正处于一个高速发展和激烈竞争的阶段,芯片企业凭借其技术创新和产品优势,在这场没有硝烟的战场上竞技,寻求占据有利位置。

至强芯片更新 数据中心角力

需要指出的是,实现生成式AI的基础设施并非只有GPU,还包括CPU、ASIC、FPGA、TPU等多种类型的计算芯片,而各家芯片厂都在串联多样性算力的解决方案。目前,这些针对AI的芯片的一大核心场景是数据中心。

英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰在接受21世纪经济报道等媒体采访时表示,去年是生成式AI的元年,有资源会优先建设智算数据中心,但是从去年下半年开始通算数据中心恢复建设节奏,同时大家也在加大智算数据中心的建设。因为企业利润结构中很多还是来自于传统的通算数据中心,真正导入生成式AI产品的企业占比大概只有10%。

面对持续增长的数据中心市场,近年来芯片巨头、互联网巨头,都在持续推出用于数据中心的服务器芯片,来满足计算和推理需求。

以英特尔为例,在Gaudi芯片系列之外,此次还为面向数据中心、云和边缘的下一代处理器进行了品牌焕新,即英特尔至强6。其中,配备能效核(Ecores)的至强6处理器将于2024年第二季度推出,配备性能核(P-cores)的至强6处理器将紧随其后推出,带来更高的AI性能。

这两款处理器的架构有所不同,配备能效核的英特尔至强6处理器采用Sierra Forest架构,据介绍,其与第二代至强处理器相比,每瓦性能提高2.4倍,机架密度提高2.7倍;配备性能核的英特尔至强6处理器使用Granite Rapids架构,与使用FP16的第四代至强处理器相比,可将下一个token(文本最小单位)的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。

可以看到,新一代的至强处理器更加强调性能和对生成式AI的支持能力,并且英特尔联合SAP、RedHat、VMware等软件厂商创建开放平台助力企业AI创新。

与此同时,互联网厂商也频频发力。比如,谷歌推出首款专为数据中心设计的基于Arm架构的CPU,命名为Axion;TPU则研发已久,已经推出第五代芯片TPU v5p,用于大模型训练和推理。

微软也发布了首款自研AI芯片Azure Maia 100 AI芯片和Cobalt 100 CPU,均先用于自家的Azure云服务。

亚马逊同样在加大投入,Amazon Trainium和Amazon Inferentia芯片可以提供在云上训练模型和运行推理的最低成本;在CPU方面,有自研的Arm架构服务器芯片Graviton,首款产品在2018年发布,近5年间一共更迭了四代。

另外,从国内市场看,华为发展基于Arm架构的服务器CPU鲲鹏芯片,也推出了昇腾AI芯片,并且围绕鲲鹏和昇腾构建新的计算生态。

数据中心领域的竞争态势呈现出多元化发展的趋势,各大企业不仅在硬件技术上争夺先机,同时也在构建适应未来AI需求的综合性计算解决方案。

财报结构变化 晶圆代工赛跑

在芯片产品线的竞争之外,值得注意的是,英特尔上周还发布了全新财务报告结构。简而言之,从2024年第一季度开始,英特尔的晶圆代工业务彻底独立运营,以更中立的角色为英特尔和外部厂商提供制造服务。

具体而言,英特尔晶圆代工成为新的运营部门,包括代工技术开发、代工制造和供应链,以及代工服务三个部分;英特尔产品部门下设三个事业部,分别是客户端计算事业部(CCG)、数据中心和人工智能事业部(DCAI)、网络与边缘事业部(NEX)。

目前已独立运营的FGPA公司Altera、已独立上市的Mobileye、及其他方面的业务统称为“所有其他”(All Others)类别,与英特尔晶圆代工(Intel Foundry)、英特尔产品(Intel Products)三大板块共同组成英特尔的商业版图。

英特尔认为,此次财报结构的变更能够更好地与同行业绩进行比较,同时推动各部门做出更好的决策,从而提高英特尔的竞争力。同时,英特尔也披露了财务数据,目前其晶圆代工业务还在投入期,2023年整体亏损为70亿美元。

英特尔表示,从现在到2030年底,英特尔代工正在努力实现盈亏平衡的运营利润率,英特尔代工的运营亏损预计在2024年达到顶峰,目标是2030年底毛利率达到40%,运营利润率达到30%。而英特尔产品方面的目标则是2030年底毛利率达到60%,运营利润率达到40%。

按照英特尔的规划,将在2025年完成“四年五个制程节点”计划,其夺取全球晶圆制造领先地位的野心早就体现在其近期的布局中。不久前英特尔刚宣布购买了6台ASML的最新型号NA EUV光刻机,同时也计划未来5年在亚利桑那州、俄亥俄州、新墨西哥州和俄勒冈州投资1000亿美元新建或扩建晶圆代工厂。

目前晶圆代工市场上,台积电一家独大,占据半壁江山,英特尔下重金挑战。行业面的好消息是去年底开始,晶圆市场也开始恢复增长势头。根据Counterpoint Research数据,2023年第四季度全球晶圆代工行业收入同比下降3.5%,但环比增长约10%。尽管宏观经济不确定性挥之不去,但在智能手机和个人电脑行业供应链库存补充需求的推动下,该行业在2023年下半年开始触底反弹。

整体而言,英特尔正在积极扩展其在晶圆代工市场的影响力,同时也在AI领域全力以赴,与全球多个半导体厂商进行竞争。面对来自各方的竞争压力,英特尔正在重塑新的壁垒。

本文标签: 英伟达  英特尔  芯片  处理器  amd  gpu