您现在的位置是:系统运维 >>正文

AMD死战CUDA:我是一家软件公司

系统运维192人已围观

简介撰稿| 言征出品 | 51CTO技术栈微信号:blog51cto)两个月前,在巴塞罗那的一场圆桌会议中,AMD高管们向外界透露一项惊人的变革消息。AMD正在进行一项重大改变:重心将从硬件开发转向强调软 ...

撰稿 | 言征

出品 | 51CTO技术栈(微信号 :blog51cto)

两个月前,软件在巴塞罗那的公司一场圆桌会议中,AMD高管们向外界透露一项惊人的软件变革消息。

AMD正在进行一项重大改变:重心将从硬件开发转向强调软件开发、公司API 和 AI 体验 。软件

AMD执行副总裁兼首席商务官Phil Guido和计算和图形业务组高级副总裁兼总经理Jack Huynh没有拐弯抹角:

“AMD将软件工程团队规模扩大了三倍,公司并且全力以赴投入软件开发 。软件”

1.49亿美元收购 ,公司3倍扩张研发团队

此前8月 ,软件我们报道了AMD豪掷49亿美元收购服务器制造商ZT的公司新闻,原因也是软件AMD亟需ZT的1100多名软件工程人员来为其接下来的发展战略来服务 。源码下载AMD彼时只有500名左右的公司开发人员。从这一变化我们也可以看出一些端倪 ,软件硬件公司AMD不止满足于设计硬件了。公司

这一场“软件团队大扩张” ,软件意味着AMD即将迎来一场员工的角色变革。

这不仅意味着引入更多人,更意味着接下来的人员工作内容的变动:“我们将组织中的一些最优秀的人才调动到这些团队中来提供支持 。”当这一转型完成后 ,该公司将更接近于同行 ,比如英伟达 、亿华云英特尔。

具体如何转变?AMD领导层回应说,过去他们“首先是硅,然后才考虑软件开发工具包 、工具链 ,最后是ISV(软件开发公司) 。”

“我们战略上的转变是首先与ISV交谈……了解开发者希望实现什么功能 。”这是创建新处理器方式的根本性变化。

“过去的AMD只会追求速度和性能。模板下载之后  ,AMD将首先关注AI软件,我们(已经)知道如何造硅。”

从这些谈话可以看出:AMD相信他们现在已经拥有了完整的计算硬件堆栈,从 CPU 到 AI 加速器,到 GPU,到 FPGA,再到数据处理 ,甚至服务器架构。目前在接下来的AI时代的“芯片角逐战”拼图中 ,AMD只剩下一块 :软件(及生态)。

2.架构二合一计算芯片置于游戏芯片之上

9月10日,Jack Huynh再次给外界一个意外的高防服务器宣布 :AMD将自家已有5年历史的图形架构RDNA  、计算架构CDNA重新整合在一起,推出名为“UDNA”的全新GPU架构。

早在2019年 ,AMD大刀一挥,历史悠久的GCN GPU架构宣告终结,从此分为两条路线 :RDNA架构面向图形与视频,也就是我们熟知的Radeon游戏显卡  ,而CDNA架构则面向AI 、HPC,也就是源码库Instinct计算卡 ,迄今都已经发展了三代。

但今时不同往日,游戏、计算重新回到了二合一 。

Huynh解释道 :(当时)分为两种架构是为了更好地各自优化,包括架构优化、开发优化 ,但现在统一架构对于开发者来说更轻松 ,不再需要做选择 ,尤其是当AMD的数据中心业务越做越大之时 。

这也是AMD也与开发者进行了充分的服务器租用交流的结果 ,开发者表示非常欢迎统一架构 ,减少了复杂性。

此外,Huynh承认 ,RDNA架构发展过程中犯了一些错误  ,比如内存一致性 、缓存子系统的不断改变,每次都需要重新优化 ,以后不会继续这样了 。

当Huynh并没有提及另一个重要的原因:市场收入的表现。近期财务报告显示 ,AMD目前一半的销售额都来自数据中心产品。

在一场有关UDNA的采访中 ,Huynh透露,此番动作也是想追赶英伟达自家通用CUDA平台的成功 。因此 ,AMD推出新的架构,也是必然 。

技术路线的改变背后则是两支研发队伍的整合 。“这是一个从云侧到端侧的统一策略,两支队伍将合二为一 ,更加高效  ,或许会有一些曲折,但相信这是正确的方向。”

也许会有人问 :难道未来的Radeon显卡、Instinct计算卡都会使用同样的芯片?是否会存在功能性上的冗余和浪费?

比如计算卡并不需要图形与视频功能,游戏卡也不需要太多的计算功能。

这一点Huynh并没有给出明确的答案。但从他透露的规划——接下来不仅会有RDNA 5 、RDNA 6 、RDNA 7  ,也会有UDNA 6 、UDNA 7,至少已经规划好了未来三代  ,RDNA和UDNA至少还会同时存在 。

这也不难理解,因为AMD的产品需要稳定 、持续的优化,并保持完全的前后兼容性。

但三代以后会怎样?小编猜测,未来极有可能只剩下UDNA了。因为未来的GPU显卡将成为图形 、视频和计算的综合体 ,正如同AI的未来将是多模态一般 。

“要确保AMD做正确的事。”

3.死战CUDA ?AMD野心的胜算

AMD 唯一的前沿领域是软件 ,而对于AI领域而言 ,便是CUDA 。

正如前文所述,AMD把以消费者为中心的 RDNA 和以数据中心为中心的 CDNA 架构统一到一个名为 UDNA 的微架构中 ,这一招醉翁之意直指气候大成的CUDA生态。

合并架构的影响很大 ,AMD通过降低高端游戏显卡的优先级,就可以达成两件目的——

一来 ,AMD对内可以集中力量共同攻坚AMD版的“CUDA”软件 ,二来,原来游戏显卡和计算显卡的开发者群体迎来大合并 ,这无疑可以加速其开发者市场份额的增长。

野心的獠牙已经亮出  ,那么背后的实力允许吗 ?

英伟达的CUDA 生态系统已经根深蒂固 ,但并非无懈可击。

首先 ,AMD只是没有将软件当成其主要产品 ,并非完全忽视了软件。AMD暗暗留了一手:开源。通过GPUOpen和ROCm等举措 ,AMD保持其大部分软件基础为开源 ,这对软件开发人员来说是极好的资源,开发者绝对支持开源。

AMD完全可以借鉴开源的商业打法进一步抢占市场 ,比如开发出一种能让人们购买其硬件并给开发者带来收入的产品 。

AMD当然也意识到了这一点,并希望“在我们的CPU和RDNA之间创建一个统一的架构  ,这将使我们能够简化软件的开发” 。这看起来与英特尔的OneAPI类似,很有意义 ,但也将是一个具有挑战性的项目。

英伟达则在这方面有着天然优势 ,因为这家公司只有一种加速器——运行CUDA的GPU  ,这是一个所有开发者都可以学习的单一API  ,使英伟达能够在价格从200美元到30,000美元的硬件上解决大量的计算挑战 。

其次 ,AMD同样也有一个英伟达不具备的优势。AMD拥有丰富的计算解决方案知识产权组合,从经典的CPU和GPU ,到XDNA FPGA芯片(通过收购赛灵思获得)。现在 ,AMD只需要将这些组合在一起,展示一个统一的计算接口 ,使得在这些核心品类之间战略性地转移工作负载变得容易 ,从而最大限度地提高性能、成本效益或两者兼顾 。

这样的能力,将使AMD能够向客户销售由CPU、GPU和专用FPGA(们)等组件组成的单一产品组合加速器系统——就像你购买iPhone ,而不是分别购买屏幕 、处理器 、5G调制解调器和电池并自行组合一样。

4.追上英伟达 ,AMD需要3到5年

AMD正在考虑一个三到五年的时间框架 ,建立自己的软件生态系统。

围绕这个目标,我们看到了AMD的一些动作  。比如,AMD豪掷49亿美元 ,大幅增加了其软件工程师的人数。

再比如 ,AMD还更新了加速硬件开发的计划:“我们打算每12个月推出一款新的[Radeon] Instinct产品”  ,这是一项艰巨的任务,但有助于更快地应对软件市场及其需求的变化。在CPU方面,AMD“现在专门设置了两个CPU团队  ,一个负责n+1(下一代) ,另一个负责n+2(两代之后)”。

还有,今天将游戏GPU、计算GPU统一合并为一种架构UDNA,亦是其中的一环。

那么回到当下 ,AMD到底怎么想的 ?采访中记者问道:游戏领域 ,AMD拥有领先地位,难道不会追求旗舰市场吗 ?Jack Huynh相当坦率 :现在的目标是以较低的价格点建立规模和市场份额,而不是“山丘之王”旗舰 GPU,以量取胜 。

“我们现在的首要任务是为 AMD 建立规模。因为现在没有规模,我就无法找到开发人员。如果我告诉开发者,我只想争取 10% 的市场份额 ,他们只会说,Jack,我祝你一切顺利,但我们必须与 Nvidia 合作 。所以 ,我必须向他们展示一个计划,说 ,嘿,我们可以通过这个策略获得 40% 的市场份额。然后他们说 ,我现在和你在一起了 ,Jack’ 。现在 ,我将在 AMD 上进行优化。一旦我们得到它,那么我们就可以追求Top。”

5.写在最后

对于昨天的芯片的巨头而言,角逐的焦点更多是光栅化、光线追踪和带宽的竞争 ,然而接下来 ,生成式AI的爆火已经打乱了原来的布局,下一代的挑战不止在于硬件 ,还在于软件支持 ,在于软件开发者生态是否足够紧密。

AMD甚至认为 ,CPU和GPU之间永恒的拉锯战在未来会发生变化 :“我们不能将AI视为像USB那样的复选框/花哨功能——AI有可能成为主角。”

有人士曾这样评价AMD和英伟达:

AMD 是一家硬件公司,它生产软件以支持其硬件;而 NVIDIA 是一家软件公司,设计硬件以加速其软件。

不过,这种“刻板印象”即将改变。AMD正在蓄势转向自己的软件生态。诚如圆桌上AMD发言人所说——

过去的AMD只会追求速度和性能,新的AMD将首先关注AI软件。

Tags:

相关文章


滇ICP备2023006006号-40