shibo体育游戏app平台英伟达的GPU在AI方面也透显露色-世博app官方入口(中国大陆)官方网站

栏目分类

热点资讯

shibo体育游戏app平台英伟达的GPU在AI方面也透显露色-世博app官方入口(中国大陆)官方网站

发布日期：2024-09-18 07:04 点击次数：79

淌若您但愿不错常常碰面，宽待标星保藏哦~

来源：内容编译自IEEE，谢谢。

很难夸大英伟达在AI领域的主导地位。设立于1993年的英伟达最初在个东说念主规画机图形处理单元（GPU）领域崭露头角。关联词，是公司的AI芯片，而非PC图形硬件，股东英伟达踏进全球最有价值公司之列。事实阐明，英伟达的GPU在AI方面也透显露色。因此，其股价自2020岁首以来依然增长了15倍以上，收入从2019财年约120亿好意思元跃升至2024年的600亿好意思元；这家AI巨头的最初芯片如沙漠中的水一样稀缺且备受追捧。

"获取GPU对AI商议东说念主员来说依然成了巨大的担忧，以至于他们每天都在念念考这个问题。因为莫得它们，即使领有最佳的模子，他们也无法尽情阐发，”谷歌DeepMind的AI数据进展东说念主詹妮弗·普伦德基（Jennifer Prendki）示意。普伦德基依赖英伟达的程度较少，因为谷歌领有我方的AI基础行为。但其他科技巨头，如微软和亚马逊，是英伟达最大的客户之一，并连接以极快的速率购买其GPU。据新闻报说念，好意思国规则部正在就英伟达芯片分拨和获取问题进行反把握侦查。

英伟达在AI领域的主导地位，与机器学习的爆发一样，是最近的风物。但这种奏凯源自公司数十年来的致力，旨在将GPU修复为除渲染图形外对其他任务也灵验的通用规画硬件。这一致力不仅包括公司GPU架构的演变，后者目下领有概况加快AI使命负载的“张量中枢”，还包括其软件平台CUDA，这为开发东说念主员运用硬件上风提供了扶植。

“他们确保每个从大学毕业的规画机科学专科学生都掌合手了CUDA编程，”Moor Insights & Strategy的数据中心首席分析师Matt Kimball说。“他们提供用具和培训，并在商议上干涉了大量资金。”

CUDA于2006年发布，匡助开发东说念主员使用英伟达GPU的繁密中枢。这在加快高度并行的规画任务方面至关要紧。英伟达在修复CUDA生态系统上的奏凯使其硬件成为AI开发的最小阻力旅途。天然英伟达芯片供不应求，但比AI硬件更难找到的，可能是教学丰富的AI开发东说念主员——而许多开发东说念主员都老练CUDA。

这给了英伟达一条深厚且日常的护城河来保护其业务，但这并不料味着它穷乏准备迫切的竞争敌手，这些敌手的策略各不疏通。天然像AMD和英特尔这么的老牌公司正在试图使用他们我方的GPU来挑战英伟达，但像Cerebras和SambaNova这么的初创公司依然开发出概况权贵提高生成式AI检会和推理遵守的篡改芯片架构。它们是最有可能挑战英伟达的竞争敌手。

AMD：另一位GPU制造商

上风：AMD的GPU是劝服力填塞的英伟达替代品

漏洞：软件生态系统无法与英伟达的CUDA相抗衡

在图形芯片领域，AMD与英伟达的宣战已赓续了近二十年。这是一场只怕抵挡衡的竞争。在图形处理方面，AMD的GPU在销售和心智占有率上很少打败英伟达。关联词，AMD的硬件有其上风。公司的日常GPU产物组合涵盖了从条记本电脑的集成图形到领有1500亿个晶体管的AI专用数据中心GPU。该公司还早期扶植并给与了高带宽内存（HBM），这是如今全球开始进GPU所必需的一种内存体式。

“淌若你看硬件……它与英伟达比拟并不失态，”Kimball说说念，他指的是AMD的Instinct MI325X，这是一款英伟达H100的竞争敌手。“AMD在这款芯片的遐想上作念得越过出色。”

MI325X筹划于本年年底推出，领有进步1500亿个晶体管和288GB的高带宽内存，尽管其在骨子应用中的透露尚待考据。MI325X的前身MI300X得回了微软的好评，微软使用包括MI300X在内的AMD硬件来处理部分ChatGPT 3.5和4的管事。Meta和戴尔也部署了MI300X，Meta在其最新的大讲话模子Llama 3.1的部分开发中使用了这些芯片。

AMD仍有一个遏制需要克服：软件。AMD提供了一个开源平台ROCm来匡助开发东说念主员为其GPU编程，但它的东说念主气不如CUDA。AMD意志到了这一瑕玷，并在2024年7月欢跃收购欧洲最大的特有AI实验室Silo AI，该实验室在使用ROCm和AMD硬件进行大界限AI检会方面有教学。AMD还筹划收购ZT Systems，一家在数据中心基础行为方面领有专长的公司，以匡助AMD更好地为部署其硬件的客户管事。打造一个概况与CUDA匹敌的敌手绝非易事，但AMD正在任重道远。

英特尔：软件奏凯

上风：Gaudi 3 AI加快器透露强盛

漏洞：下一款大AI芯片要到2025年底才会推出

英特尔的挑战与AMD相悖。英特尔费事英伟达的CUDA和AMD的ROCm的径直匹配产物，但其于2018年推出了一个开源赈济编程平台OneAPI。与CUDA和ROCm不同，OneAPI涵盖多个类别的硬件，包括CPU、GPU和FPGA。因此，它不错匡助开发东说念主员在职何英特尔硬件上加快AI任务（以偏执他任务）。

另一方面，硬件是一个瑕玷，至少与 Nvidia 和 AMD 比拟是如斯。英特尔的 Gaudi AI 加快器是英特尔2019 年收购 AI 硬件初创公司 Habana Labs的恶果，取得了进展，最新的Gaudi 3 的性能可与 Nvidia 的 H100 相比好意思。

关联词，目下尚不明晰英特尔的下一代硬件版块究竟会是什么形式，这引起了一些担忧。Moor Insights & Strategy 首创东说念主帕特里克·穆尔黑德 (Patrick Moorhead ) 示意：“Gaudi 3 越过康健。”但他示意，适度 2024 年 7 月，“还莫得 Gaudi 4”。

相悖，英特尔筹划转向一款诡计勃勃的芯片，代号为 Falcon Shores，该芯片给与基于区块的模块化架构，结合了英特尔x 86 CPU 内核和 Xe GPU 内核；后者是英特尔最近进攻图形硬件领域的一部分。不外，英特尔尚未融会掂量 Falcon Shores 架构和性能的翔实信息，展望要到 2025 年底才会发布。

Cerebras：越大越好

优点：晶圆级芯片每颗芯片提供康健的性能和内存

瑕玷：由于尺寸和资本，应用领域有限

不错折服的是，AMD和Intel是Nvidia最具信得过度的挑战者。它们在遐想奏凯芯片和构建编程平台方面有着悠久的历史。但在界限较小、未教学证的玩家中，有一个脱颖而出：Cerebras。

这家公司专注于超等规画机的AI，于2019年推出了Wafer Scale Engine，这是一块巨大的晶圆级硅片，领有1.2万亿个晶体管。最新版块Wafer Scale Engine 3将这一数字普及到了4万亿个晶体管。手脚比较，Nvidia最新最大的GPU——B200，"仅"领有2080亿个晶体管。Cerebras围绕这个晶圆级怪物构建的规画机CS-3，恰是Condor Galaxy 3的中枢，该超等规画机将由64台CS-3构成，处理高达8 exaflop的AI规画任务。G42，一家总部位于阿布扎比的企业集团，筹划使用该系统检会夙昔的前沿大型讲话模子。

“这有点偏向于特定的应用，而不是通用型的，”Bernstein Research的高档分析师Stacy Rasgon说。“并不是每个东说念主都会购买这些规画机。但他们有一些客户，比如好意思国国防部和Condor Galaxy 3超等规画机。”

Cerebras的WSC-3在大多数情况下不会挑战Nvidia、AMD或Intel的硬件；它太大、太激动、太专科化了。但它可能在超等规画机领域为Cerebras提供独特上风，因为莫得其他公司遐想晶圆界限的芯片。

SambaNova：

为Transformer而生的变形架构

优点：可竖立的架构有助于开发东说念主员优化AI模子的遵守

瑕玷：硬件还需要阐明对全球市集的掂量性

设立于2017年的SambaNova是另一家运用非传统芯片架构贬责AI检会问题的芯片遐想公司。其旗舰产物SN40L给与公司所谓的“可重构数据流架构”，由存储器和规画资源的模块构成。这些模块之间的流通不错字据需要进行为态调换，以促进大型神经网罗的数据快速传输。

Prendki以为，这种可定制的硅片在检会大型讲话模子时可能会越过灵验，因为AI开发东说念主员不错字据不同的模子来优化硬件。莫得其他公司提供这么的功能。

SambaNova还通过其配套的软件栈SambaFlow取得了奏凯。Moorhead说：“在基础行为层面，SambaNova的平台透显露色。”SambaFlow不错分析机器学习模子，并匡助开发东说念主员从头竖立SN40L以加快模子的性能。天然SambaNova还有许多要阐明的地点，但其客户包括软银和模拟器件公司。

Groq：专注于功能

优点：出色的AI推感性能

瑕玷：目下仅限于推理当用

另一家在AI硬件上有独特篡改的公司是Groq。Groq的策略是抽象结合内存和规画资源，以加快大型讲话模子对提醒的反馈速率。

“他们的架构越过留神内存。内存与处理器抽象耦合。你需要更多的节点，但每个token的价钱和性能几乎跋扈，”Moorhead说说念。“token”是模子处理的基本数据单元；在大型讲话模子中，频繁是一个词或部分词。更令东说念主印象深远的是，Groq的芯片——讲话处理单元推理引擎——给与的是GlobalFoundries的14纳米技能，而这依然是比用于制造Nvidia H100的台积电技能逾期几代的工艺。

2023年7月，Groq展示了其芯片的推理速率，运转Meta的Llama 3 80亿参数大型讲话模子时，每秒进步1250个token。这一透露致使进步了SambaNova的演示，其推理速率进步每秒1000个token。

高通：功耗至上

优点：日常的AI功能芯片组合

瑕玷：穷乏用于AI检会的大型前沿芯片

高通以Snapdragon系统级芯片著名，这款芯片为诸如三星Galaxy S24 Ultra和OnePlus 12等流行的安卓手机提供能源。高通是一家不错与AMD、Intel和Nvidia抗衡的巨头。

但与这些竞争敌手不同，高通将其AI计谋更多地王人集在特定任务的AI推理和能效上。AI基准组织MLCommons的首创成员、AI优化公司Krai的CEO Anton Lokhmotov示意，高通在关键的基准测试中权贵提高了其Qualcomm Cloud AI 100管事器的推贤人力。在ResNet-50图像分类基准测试中，这些管事器的性能从180样本/瓦普及至240样本/瓦，使用的硬件基本保持不变。

在开荒上处理腹地AI任务而无需流通到云表的高效AI推理亦然一个上风，Lokhmotov说。一个典型例子是微软的Copilot Plus PC。微软和高通与戴尔、惠普和空想等条记本制造商勾通，首批配备高通芯片的Copilot Plus条记本电脑已于7月上市。高通还在智妙手机和平板电脑市集占据强地面位，其Snapdragon芯片为三星、OnePlus和摩托罗拉等开荒提供能源。

高通如故AI驾驶辅助和自动驾驶平台的主要玩家。2024岁首，当代旗下的Mobius部门晓喻与高通勾通，使用Snapdragon Ride平台——该平台是Nvidia Drive平台的竞争敌手——用于高档驾驶辅助系统。

超大界限数据中心：

为功耗定制智能

优点：垂直整合有助于遐想

瑕玷：超大界限数据中心可能会优先得志自己需乞降使用

超大界限数据中心（Hyperscalers）——那些部署硬件界限庞大的云规画巨头——与“大科技”同义。亚马逊、苹果、谷歌、Meta和微软都但愿尽快部署AI硬件，既用于自己使用，也为其云规画客户管事。为加快这一程度，他们都在里面遐想芯片。

谷歌比竞争敌手更早投资于AI处理器：该公司于2015岁首次晓喻的Tensor Processing Units（TPU）如今撑持着其大部分AI基础行为。第六代TPU Trillium于2023年5月晓喻，并成为谷歌AI超等规画机的一部分，这是一项针对公司处理AI任务的云管事。

Prendki说，谷歌的TPU为公司在追求AI契机时提供了上风。“我很侥幸，无用挂念谈判芯片从那处来，”她说。关联词，TPU的使用并莫得完全放手供应急切，因为谷歌的不同部门仍然需要分享资源。

谷歌依然不再独处。亚马逊领有两款自研芯片，Trainium用于检会，Inferentia用于推理。微软领有Maia，Meta领有MTIA，而据传苹果也在开发处理其云基础行为中AI任务的硅片。

这些超大界限数据中心的芯片并未径直与Nvidia竞争，因为他们不向客户销售硬件，但他们确乎通过云管事提供硬件拜谒，比如谷歌的AI超等规画机、亚马逊的AWS和微软的Azure。在许厚情况下，超大界限数据中心提供的管事既运转在自家硬件上，也运转在Nvidia、AMD和Intel的硬件上；而微软则被以为是Nvidia的最大客户。

中国芯片：省略情的夙昔

另一类竞争者的出身并非源自技能需求，而是地缘政事施行。好意思国对AI硬件出口的限制扼制了芯片制造商向中国公司出售最新、最康健的芯片。手脚回复，中国公司正在遐想自有AI芯片。

国内科技巨头所推出的加快器是Nvidia H100的替代品，关联词，代工场的产量问题据称限制了供应，此外，巨头还在销售“AI一体机”贬责有筹商，旨在为中国企业提供腹地化的AI基础行为。

为了绕过好意思国的出口顾问规定，中国行业可能会转向替代技能。举例，中国商议东说念主员在光子芯片方面取得了进展，这种芯片运用光而不是电荷来进行规画。“光束的上风在于你不错让两束光交叉，”Prendki说说念。“因此，它减少了在硅芯片上频繁遭遇的限制，弗成交叉旅途。你不错使电路更复杂，且资本更低。”天然光子芯片仍处于越过早期的阶段，但中国的投资可能会加快其发展。

更多空间

显着，Nvidia 并不费事竞争敌手。一样显着的是，在夙昔几年内，莫得一家竞争敌手概况挑战 Nvidia，更别说打败它了。本文华访的统共东说念主都欢跃，Nvidia 目下占据着无与伦比的主导地位，但这并不料味着它将弥远排挤竞争敌手。

“听着，市集需要采取，”Moorhead 说。“淌若到 2026 年，我无法瞎想 AMD 的市集份额会低于 10% 或 20%，英特尔亦然如斯。频繁，市集可爱三家公司，而咱们有三个合理的竞争敌手。”Kimball 示意，与此同期，超大界限公司可能会挑战 Nvidia，因为他们将更多的 AI 管事飞舞到里面硬件上。

然后还有省略情成分。Cerebras、SambaNova 和 Groq 是繁密初创公司中的杰出人物，它们但愿通过新颖的贬责有筹商蚕食 Nvidia 的市集份额。此外，还极度十家其他公司加入其中，包括 d-Matrix、Untether、Tenstorrent和Etched，它们都寄但愿于针对生成式 AI 优化的新芯片架构。这些初创公司中可能有许多会失败，但也许下一个 Nvidia 会从幸存者中脱颖而出。

https://spectrum.ieee.org/nvidia-ai

半导体极品公众号保举

]article_adlist-->

专注半导体领域更多原创内容

蔼然全球半导体产业动向与趋势

*免责声明：本文由作家原创。著作内容系作家个东说念主不雅点，半导体行业不雅察转载仅为了传达一种不同的不雅点，不代表半导体行业不雅察对该不雅点赞同或扶植，淌若有任何异议，宽待掂量半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第3888内容，宽待蔼然。

『半导体第一垂直媒体』

及时专科原创深度

公众号ID：icbank

可爱咱们的内容就点“在看”分享给小伙伴哦shibo体育游戏app平台

海量资讯、精确解读，尽在新浪财经APP

上一篇：世博体育尽在新浪财经APP 包袱裁剪：卢昱君 -世博app官方入口(中国大陆)官方网站

下一篇：世博app官方入口(中国大陆)官方网站小订通谈将于 9 月 24 日关闭-世博app官方入口(中国大陆)官方网站