服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

AMD要拉上Hugging Face对抗英伟达了

日期: 来源:品玩收集编辑:品玩

在所有嫉妒英伟达大赚特赚的科技大厂里,AMD肯定是最憋屈的一个。

他们是常年相爱相杀的老对手。熟悉PC电脑市场的人都知道,一直以来英伟达RTX系列显卡的主要对手就是AMD Radeon系列显卡。

在最新的几次显卡迭代中,英伟达凭借光线追踪和DLSS(深度学习超级采样)等独家技术拉开了和AMD的差距,在消费级市场占据优势。

这种情况在数据中心领域被复制。本来,AMD的数据中心业务称得上可圈可点,欧洲速度最快的超级计算机LUMI和美国橡树岭国家实验室的Frontier超级计算机使用的都是AMD的处理器与加速器。

但由于半导体周期和全球经济疲软等各种因素影响,2023财年第一季度,AMD数据中心的营收是13亿美元,按年同比没有增长,与之形成鲜明对比的是英伟达数据中心业务营收达42亿,更恐怖的是其预计的第二季度的营收将达到100亿。

当然你也不能全怪AMD,实际上英伟达一骑绝尘于所有芯片厂商,目前它的市值是AMD的五倍还多(一个有趣或讽刺的事实是,AMD的市值高于英特尔)。

因为英伟的GPU被普遍认为是大模型LLM训练与推理所必不可少的“关键基础设施”,在生成式AI爆发的大背景下,算力成为了新的石油,每个人都在竭尽全力地争夺。

AMD现在想要改变人们这一固有看法。

6月13日,AMD在一场名为AMD数据中心和技术首映的发布会上公布了一系列新技术和产品。从这个名字我们就能看出来,AMD聚焦的非常精准,就是数据中心产品。

最吸引人的是名为MI300X的GPU,它直接对标了英伟达的H100——目前最先进的GPU,训练大模型必不可少的基础设施。

MI300X有高达192GB内存,提供5.2TB的带宽,AMD宣称相比上一代使用CDNA 2 架构的 MI250 提高了8倍性能和5倍效率。而MI300X内存不论密度还是容量都高于英伟达H100。

由于内存巨大,大规模神经网络甚至不需要借助外部带宽来传输数据,仅在芯片内部就能实现运行。苏姿丰Lisa Su——AMD的强人CEO,中文世界昵称苏妈,笑容满面的宣称单个MI300X就能运行800亿参数的大模型。

AMD第一款超级芯片诞生了。

与超级芯片相伴的自然是超级计算机,英伟达有DGX,AMD则推出了名为 Instinct(直觉)的计算平台。它由八个MI300X组成,因此拥有高达1.5TB的HBM3内存。

除了MI300X外,这个系列还有一款早先已经发布的MI300A,它不是纯GPU而是APU,即在一颗芯片上同时集合了CPU和GPU,晶体管数量较MI300X略少,为1460亿个,针对的也是数据中心市场。

纵观MI300系列产品,目标可谓十分精准——一切为了大模型。苏姿丰预计到2027年AI芯片市场将达到1500亿美元规模,这意味着它的复合年增长率超过50%——在全球经济缓慢复苏的大背景下,这显然是个让人垂涎的巨大市场。

理工科出身,从小就被誉为神童的苏姿丰发布产品时往往给人一种“堆料”的感觉——具体好不好用先不说,咱的诚意先摆在这里了。

苏妈靠这种“诚意”,几乎一己之力将AMD从10年前的糟糕境地中拉了出来,当时AMD的股价长期在个位数。MI300系列同样给人这种感觉,关键数据指标上十分“顶”——内存更大意味着单个GPU提供了更强的性能,这实际上等同于降低成本。

然而发布会举行的当天,AMD的股价应声下跌超过3%,而英伟达市值第二次超过万亿美元。

这是为什么?

比硬实力更重要的东西

什么东西比硬实力更重要?时间。

市场对于AMD反应不佳的原因归纳起来有两点,都和时间有点关系。

其一是,MI300X在第三季度才能提供样品,第四季度才正式生产,那么伴随工艺磨合与产能爬坡等一系列问题的逐步解决,大批量出货不会早于2024年中,相比之下,英伟达H100是2022年10月上市的,也就是说AMD比它的竞品晚了至少18个月才进入市场,这对任何领域的后发者都不是一个好消息,更不用说一日千里进步的AI加速器市场了,何况AMD面对的还是在该领域占据近60%份额的巨无霸。

第二是有关英伟达的先发优势,这种优势不仅在于英伟达更早、更大规模地进入并行计算领域,更在于它已经为之打造了一个软硬件一体协调的生态——人们使用CUDA软件充分发挥英伟达GPU的性能,而CUDA生态连接着开发者和AI生态产业链上下游——平台生态成为一条宽而深的护城河。硬件迁移或许是容易的,但核心技术、代码、开发环境的整体搬迁则要伤筋动骨得多。

AMD有什么理由说服别人转换到Instinct平台?实际上在6月13日的这场发布会上,AMD没有公布MI300X的任何客户,相比之下英伟达6月2号在COMPUTEX发布DGX GH200 超级计算机的同时就介绍了三个已经下单的大客户:谷歌云、Meta和微软。每一个都如雷贯耳。

除了时间之外,一些对技术路线的讨论也给AMD的“硬实力”蒙上了一层阴影,比如192GB的大内存。

由于采用了更适合AI计算的HBM3,而不是DDR5内存规格,MI300X面临着两个问题,第一它的售价不会太便宜,因为HBM3工艺复杂成本高昂,而如果MI300X的售价(AMD还没有公布任何价格信息)哪怕接近H100,都会让它的吸引力大打折扣。

第二,采用HBM3内存并不是AMD的独家发明,而是业界通行做法。英伟达Grace Hopper 超级芯片里的GPU同样使用了HBM3内存(96GB),因此它无法构成显著的技术护城河——甚至,超越的方法都不限于一种。比如英伟达的NVLink技术可以在几乎无损的情况下串联256个Grace Hopper 超级芯片,这让超级计算机的内存容量高达144TB。

AMD的软实力解法

AMD自己不会不知道这些问题,特别是英伟达CUDA护城河,想要突破这种时间积累起来的优势,非得想一些绝招不可。

其实AMD有自己类似CUDA的GPU生态软件系统,名叫ROCm,但一直以来都存在诸多缺点,比如操作系统长期只支持Linux,一度只适配高端显卡等等,加上参加革命比较晚,让ROCm始终无法稳定构建一个强大的开发生态——相比之下CUDA有超过400万以上的开发者。

于是AMD想到了合作。在发布会上AMD公布了两项合作,一个是PyTorch基金会,这让ROCm(也就是AMD芯片)能够全面支持PyTorch 2.0。

另一个合作对象则是人工智能初创公司Hugging Face。双方的合作将确保AMD的硬件针对Hugging Face的模型进行优化,以充分发挥像MI300X这种硬件的潜力。AMD宣称在初步的测试中,MI250在BERT-Large训练上比竞品快了1.2倍,而GPT2-Large训练上则快了1.4倍。

这种合作对吸引开发者和客户转投AMD平台有一定的吸引力。Hugging Face是一个主张开源的模型服务提供商,平台上托管了数以万计的预训练模型和数据集,许多企业正在利用这个平台构建、训练和部署自己的AI模型。

这恰好能补上AMD在平台生态上的短板,因为ROCm实际上也是基于开源项目编写的,它不限定编程技术,框架上除了支持PyTorch外,还有Tensorflow,甚至通过HIP,ROCm能够实现对CUDA的完全兼容。与Hugging Face的合作将让ROCm与其开源库无缝集成,也就是说Hugging Face的模型在AMD芯片上能够做到开箱即用而不需要开发者复杂的调试。

Hugging Face已经在官网表示,Transformer架构和生成式AI模型都将得到这种支持,这显然将促进AMD的生态繁荣,意味着很快我们将能看到基于AMD芯片原生训练的大模型。

极速变动的市场与不愿被垄断的需求

Hugging Face是目前十分活跃的人工智能领域独角兽企业,模型托管服务和开源特性让它成为了许多大厂的合作伙伴。

仅仅今年上半年,Hugging Face就宣布了与亚马逊云和IBM的合作,还进一步深化了和微软Azure原本就有的紧密关系。

AMD只是Hugging Face一连串合作列表里最新一个而已。它的加入标志着大模型和生成式AI的兴起正在使云服务提供商和芯片提供商为开发者提供更多基础服务——不仅包括算力,也包括各种基础模型的调用。

这正是AMD缺乏而Hugging Face具有显著优势的领域。Hugging Face的口号之一是让人工智能民主化,这也就意味着它从根本上反对任何对市场的垄断和独占行为,同AI产业的上下游紧密协作不仅有利于让更多的人受益于最新的软硬件技术,还通过引入竞争让这些技术变得更具性价比——也就是所谓民主化了。

“开源意味着可以自由地基于广泛的软硬件中构建解决方案。”在与AMD合作的博客文章最后如此说到。

这显然为AMD在AI领域的奋起直追创造了条件,因为“民主化”的另一种说法就是“生态繁荣”,而繁荣的生态构建了英伟达最宽广的护城河。

AMD还有机会。路透社曾在AMD发布会前后脚宣称亚马逊云正在考虑使用AMD的最新产品,这让AMD的股价应声而涨——因为大家都非常关注英伟达潜在的替代选项。

实际上包括谷歌、Meta等在内的云服务大厂都在打自研芯片的主意,为的就是不再白白给处于近乎垄断地位的英伟达交“算力税”,五月时甚至一度传出微软在和AMD展开芯片领域合作。

大家这种不约而同的反应恰恰反映了如今AI产业正处于一个激烈变革的时间节点,它孕育着机会。对AMD来说这一场战役也不容有失:AI产业爆发的另一面是整个行业大环境的下行压力进一步加大,巨头们投入GPU的预算越多,留给数据中心别的业务的钱就越少——而这在过去是AMD营收的重要来源。

苏姿丰把人工智能上升为AMD的“最高战略优先级”,MI300X是她最新的得意之笔,但正如我们前面所分析的,硬实力之外AMD还需要有更巧的软实力打法,才能在这场千载难逢、剧烈变动却又森严的竞争版图中为自己挣得应有的地位。

2006年,AMD收购ATI获得了图形处理技术,由此展开了和英伟达在GPU领域漫长的竞争。现在,这场比赛正式进入了名为“人工智能”的新赛季。

我们拭目以待。


相关阅读

  • 人工智能赋能千行百业 领航数字生产力跃升蝶变

  • 人工智能与一、二、三产业融合成效显著,引擎作用日益凸显。大模型作为人工智能的新业态,已成为产业数字化与智能化的重要支撑。业内专家表示,人工智能是引领新一轮科技革命和产
  • 腾讯大模型,沾点阿里味

  • 大模型赛道的发令枪响彻云霄。对于科技巨头而言,这不仅仅是一场技术竞赛,更是对未来商业模式、技术趋势和市场需求的深度探索。国内互联网科技圈中的领头羊之一腾讯,终于迟迟迈
  • 掌趣科技:在积极关注国内相关AI大模型的发展

  • 2023年6月21日,掌趣科技(300315)在互动平台回复称,公司一直密切关注新技术、新产品的发展趋势及其与公司自身业务相结合的可行性。公司也在积极关注国内相关AI大模型的发展。
  • 苹果自助维修计划增加iPhone 14系列手机

  • 【环球网科技综合报道】6月21日消息,苹果公司宣布,将为 iPhone 14系列手机和部分 M2 Mac机型提供自助维修服务。其中,涉及的M2 Mac机型主要包括,搭载M2 芯片13英寸 MacBook Air
  • 两天大涨30亿,美图当家人难掩焦虑

  • 记者|谢之迎编辑|陈晓平 江昱玢美图董事长、CEO吴欣鸿,自称如履薄冰。因为AI,一张美图已是“生死存亡之秋”的微信截图,前段时间在网上流传。6月19日,吴欣鸿一口气发布7款新品,推出
  • “擂响战鼓”的中国AI大模型

  • 《中国经济周刊》 记者 孙冰 | 北京报道谁是当下中国乃至全球的“科技顶流”?AI大模型几乎毫无争议。5月28日,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • AMD要拉上Hugging Face对抗英伟达了

  • 在所有嫉妒英伟达大赚特赚的科技大厂里,AMD肯定是最憋屈的一个。他们是常年相爱相杀的老对手。熟悉PC电脑市场的人都知道,一直以来英伟达RTX系列显卡的主要对手就是AMD Radeon
  • 万源:做强产业支撑,推动制造业高质量发展

  • 近年来,万源市坚定贯彻“大抓工业、重抓制造业”战略,强力推进工业重点项目建设,围绕“山头、地头、石头、木头”特色资源,以农产品加工、绿色建材、清洁能源等为重点方向,努力打
  • 塑心学堂 | 冠心病合并高尿酸血症要注意什么?

  • 【塑心学堂 开栏语】用心呵护生命,用爱延伸服务,塑心学堂专栏将定期推送心脏和急危重症相关的防治及养生保健科普知识,为您排忧解惑!说起尿酸高,大家首先会想起来痛风,就会想到啤
  • 耳鼻喉医话 | 鼻炎调理,把握夏季黄金期!

  • 医学指导:广东省名中医、岭南名中医、博士生导师。广东省中医院耳鼻咽喉头颈科主任医师、学术带头人李云英教授。开栏语本专栏将定期推送中西医耳鼻咽喉疾病的预防、治疗及