2023年超威半导体研究报告:紧盯AI前沿技术,打造综合数据中心平台

您所在的位置:网站首页 超威半导体amd股票行情 2023年超威半导体研究报告:紧盯AI前沿技术,打造综合数据中心平台

2023年超威半导体研究报告:紧盯AI前沿技术,打造综合数据中心平台

2024-06-16 09:29| 来源: 网络整理| 查看: 265

1. 公司基本概况

1.1 公司简介

美国超威半导体公司(以下简称“公司”或“AMD”)是高性能与自适应计算领域的领先企业,专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、APU、主板芯片组、电视卡芯片等)、闪存和低功率处理器解决方案。公司在高性能计算、图像处理、可视化科技等方面有 45 年的领先经验,AMD 为电脑、通信及消费电子市场供应各种集成电路产品。全球数以万计的消费者、世界500 强企业、尖端科研机构使用AMD 的产品去改善和提高我们的生活、工作和娱乐。公司技术推动着数据中心、嵌入式系统、游戏和 PC 市场迈向未来。

公司在全球 CPU、GPU 市场中处于较领先位置,对标行业巨头英特尔、英伟达。2023 年第三季度公司实现 58 亿美元的营收,x86 系统CPU市场占有率接近 40%,全球领先。

1.2 主要产品和服务

公司的主要业务有客户端业务、游戏业务、数据中心业务和嵌入式业务,主要产品有 CPU,GPU,SOC,加速计算卡,嵌入式处理器等。数据中心业务中主要面向云计算、高性能计算、AI 计算、DPU,产品包含霄龙处理器、Instinct MI GPU 加速器、Pensando DPU 产品;游戏业务包括半定制SOC、消费显卡,产品包含 Radeon 系列显卡、Radeon Pro 系列显卡;在客户端业务主要为处理器,包括锐龙、速龙处理器、Threadripper PRO处理器、锐龙Pro 处理器;在嵌入式业务面向医疗保健,工业,机器人,汽车,计算机视觉,产品包含锐龙和霄龙嵌入式处理器、ALVEO、VERSAL和ZYNQ系列产品。 2023 年 Q3 季度,公司总收入 58 亿美元,同比增长4%。毛利率为47%,同比上升 5%。其中,数据中心收入 16 亿美元、客户端收入15亿美元、游戏收入 15 亿美元、嵌入式系统收入 12 亿美元。

1.3 历史与转型

AMD 成立于 1986 年,现任董事长为苏姿丰博士(Dr. Lisa T. Su)。苏姿丰博士于 2012 年 1 月加入 AMD,担任公司高级副总裁及全球事业部总经理,负责推动 AMD 产品与解决方案的端到端业务执行。在2014年接手公司之际,AMD 面临强大的竞争压力,主要对手就是行业巨头英特尔。2014年开始,苏姿丰博士开始掌舵超微半导体,在她的带领下,公司成功转型成为高性能和自适应计算领域的领先企业,同时也是全球发展最快的半导体公司之一。现在 AMD 在桌面端、移动端、服务器端全面发力,快速抢占市场。股票从 2016 年的 2 美元一跃至现在的 139 多美元一股。

2. AI 算力为核心-云与数据中心业务

2.1 AI 的竞争是算力的竞争

2.1.1 算力即是竞争力

随着社会进入数字化时代,算力对数字经济发展具有重要影响。数字经济发展关乎大国的竞争力。人工智能是驱动数字经济的重要力量。人工智能技术的突破对算力的发展提出了进一步的要求,人工智能通过训练与学习形成模型,应用到各个使用场景,形成新的生产力。当应用场景变得复杂,训练与学习对算力的要求会逐步增长,同时对应的处理效率也会同步增高。发展的核心是算力。 各国都高度重视算力的发展。美国商务部认为AI 算力是超级计算所推动的,超级计算的基础就是先进半导体的制造能力。基于超级计算的AI 系统可以提高国家层面的决策的速度、准确度及相关产业的未来发展。中国《数字中国建设整体布局规划》要求系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局,积极提高算力竞争力。

2.1.2 AI 算力的核心在处理芯片

超级计算和超级计算机推动的 AI 的比拼还是在芯片上。面对对话式AI的挑战,计算的难度开始爆发式的增长,对训练大模型芯片的算力提出了更高的要求。鉴于高性能计算芯片、加速芯片(GPU/APU/DPU)的设计和制造难度,目前市场竞争的核心主要在英伟达、英特尔、超微半导体三家企业之间。量产高性能 AI 计算处理芯片(GPU/APU)的竞争主要在英伟达和超微半导体之间;具体来说,在英伟达 H100/A100 及其后续型号和超微半导体InstinctMI250 及其后续型号之间。

2.2 人工智能市场前景广阔

AI 市场具有很强的发展前景。根据 Statista 的数据,人工智能市场在2023年的市场规模为 2079 亿美元,根据预测,到2024 年市场规模将达到2982亿美元的规模,同比年增长率 43.43%。到2030 年,这一数字将会达到18474亿美元,CAGR 达到 36.34%。

具体到人工智能服务市场,根据 IDC 数据,人工智能IT服务在当前是市场的主流,2021 年上半年实现了 20.4%的同比增长,全球支出达到184亿美元。到 2025 年,人工智能 IT 服务将超过 400 亿美元,是2021 年的两倍多。商业服务相对 IT 服务占比较低,但也在持续增长,预计到2025 年商业服务的营收将会突破百亿美元大关。

根据 Research Dive 分析,全球 AI 加速器芯片市场在2021 年为149亿美元,以 39.3%复合年增长率增长,到 2031 年市场规模有望增长到3321亿美元。具体到各个芯片种类,根据 Allied Market Research 数据,AI 智能芯片主要分为 GPU, ASIC, FPGA, CPU, 和一些其他细小类别。从2022年数据来看,CPU 板块的营收是市场的主导。根据预测ASIC 板块未来CAGR最高。

2.3 构建 CPU+GPU+DPU 数据中心组合服务平台

2022 年开始,公司进行了战略重心转向,从个人电脑、游戏全面转向数据中心和人工智能。公司通过收购赛林斯(Xilinx),Pensando,打造集合CPU、GPU、DPU、AI 支持软件生态系统的完整组合服务平台。数据中心的营收贡献持续增高,季度收入由 2021Q2 的 8.113 亿美元,到2023Q2的13.21亿美元。2022 年全年数据中心收入 60.43 亿美元,营收占比25%,同比增长64%。2023Q3 季度,数据中心业务营收16 亿美元,同比增长持平,营收占比 27.58%,为各个业务板块之首。

2.3.1 GPU:抢占加速器市场,Instinct MI300 型加速器

2023 年 12 月 6 日,AMD 发布 MI300X 加速器,称其为性能最高的芯片。AMD Instinct MI300 系列包括 MI300A 和MI300X 加速器模组。MI300A是针对单一伺服器插槽的加速处理单元(APU),是世界首款在单组晶片上结合 GPU、CPU 和高频宽记忆体(HBM3)的加速处理单元,旨在为超级计算提高资料传输效率和运算密度。MI300X 专注生成式AI,在标准服务器平台上为每个运算节点提供了强大的平行运算能力,每个节点可搭载8组OAM 型态的加速器模组,有效的减少大模型所使用的GPU个数。AMD Instinct MI300 系列中 MI300 芯片拥有超过1500 亿个晶体管;新芯片的内存是英伟达 H100 芯片的 2.4 倍。新款芯片在(大语言模型)训练方面的性能与英伟达 H100 芯片相当;相比英伟达竞品,MI300 运行AI 模型的速度更快。

新的 GPU 有利于公司抢占英伟达的市场份额,利好明年营收增长。超微半导体是目前极少数可以量产匹配英伟达算力GPU/APU的公司。同时,公司开始构建超微半导体的AI软件生态圈, 公布了与新芯片相匹配的软件套件。公司财报显示,MI300 型芯片季度的营收将达到4 亿美元,2024年全年的营收有望超过 20 亿美元。公司预计,MI300 型芯片将成为公司有史以来销售额最快达到 10 亿美元的产品。微软、Meta、Oracle 已经开始与AMD的合作。综合分析,MI300 型芯片及配套的软件系统是目前少数可以和英伟达芯片和系统对标的产品,具有较强的增长前景和竞争潜力;头部企业当前已经小批量使用,公司产品未来大概率可以替代部分英伟达的产品,从而占领AI 市场份额。

2.3.2 AI 软件生态构建:兼容英伟达 CUDA,AMD ROCm开始发力

ROCm 是 AMD 提供的开源软件平台,对标英伟达CUDA平台。相较于英伟达的 CUDA,ROCm 起步相对较晚所覆盖的场景没有CUDA丰富,但ROCm 已经开始发力追赶。ROCm 目前主要面向超级计算,为高性能计算和机器学习系统提供平台工具。ROCm 平台提供包括驱动、开发者工具、API、GPU 监控工具,平台支持 AMD 和其他的加速器件。系统制程多种架构和模型包括:HIP、OPENMP、OPENCL,同时免费提供Compiler, debugger和 Library。ROCm 已经键入了许多机器学习系统:Tensorflow、PYTORCH、KOKKOS、RAJA 等。 ROCm 的核心是可移植性的异构计算接口HIP (Heterogeneous ComputeInterface for portability), 它可以使得开发者所编写的代码在英伟达CUDA系统下使用。简单的来说,从 CUDA 源码可以使用HIPify 工具转换到HIP源码上,HIP 源码能够通过不同的编译工具实现在AMD或NVIDIAGPU这两种 GPU 上运行。ROCm 的最新版本为ROCm 6,在MI300系列上运行ROCm 6 的效能是目前使用 ROCm 5的MI250 的8 倍。

2.3.3 CPU:对标英特尔,AMD EYPC 霄龙开始发力

AMD 在服务器 CPU 板块主要产品为 AMD EYPC 霄龙芯片。在2023年AMD推出了新一代的第四代 EYPC 霄龙芯片,采用台积电5 纳米先进制程工艺,拥有 96 个核心,12 条记忆通道,每瓦效能相较竞品提高两倍,总体效能是竞品的 2.8 倍。AMD 的技术提升主要依靠的是小芯片(Chiplets)和先进封装技术。Chiplet 技术首先将 CPU 复杂功能进行分解,针对单一特定功能(如数据存储、计算、信号处理、数据流管理)、设计可相互进行模块化组装的裸芯片,并最终以此为基础,组合成一个 Chiplet 的芯片网络,通过Infinity Fabric系统总线连接它们,最后封装在一起形成一个芯片。目前 AMD 在服务器 CPU 方面已经开始追赶行业巨头Intel,根据Statista的数据,在服务器端,2023 年 Intel 四季度 x86 系统服务器CPU的市占率为61.1%的,AMD 的市占率为 35.6%。但是,在 PC 端(笔记本电脑领域),英特尔还是保持相对的领先地位市占率超 7 成。营收方面,2023 年,AMD数据中心业务第一季度、第三季度营收同比增长持平,第二季度营收同比下降11%;而英特尔数据中心营收衰退明显,Q3 收入同比下降10%至38 亿美元,2023年第一季度和第二季度数据中心收入同比下降 39%、15%。

2.3.4 DPU:专注数据中心任务,AMD Pensando

NVIDIA 首席执行官黄仁勋表示:“它(DPU)将成为未来计算的三大支柱之一。”DPU(Data Processing Unit,数据处理器)已经成为了以数据为中心的加速计算模型的第三个计算单元,主要应用在数据中心数据处理的计算单元。面对数据中心海量的数据,传统的CPU 已经“不堪重负”,DPU的工作简单的来说就是卸载(Off-load)、加速和隔离——把CPU的部分工作卸载到自己身上;利用自己的算力特长,对这些工作进行加速运算;整个过程,实现了计算的隔离。 DPU 是 AMD 构建数据中心板块的重要组成部分,在2014 年苏姿丰博士接手公司时就已认识到未来数据中心和云端的重要性。AMD在2022年4月4日宣布将以 19 亿美元的价格收购 DPU 厂Pensando。Pensando是由一群曾经任职于思科(Cisco)的工程师于 2017 年成立的公司,主要产品为分布式服务卡(DSC),一种具有计算核心的特定领域可编程处理器。最新一代的DSC 产品采用了 Arm 架构,由台积电 7nm 制程加工制造。

Pensando 的最大优势在于其实现了支持P4 网络数据面编程的处理引擎,是当前极少数商用的芯片 ASIC 实现的网络侧P4 数据面编程引擎。Pensando客户广泛包括 IBM 云、Microsoft Azure、甲骨文云端和高盛在内的许多大型企业。 GPU 具有极强市场潜力,根据 Precedence Research 的预测,2022年亚太地区的市场规模约为 135 亿美元,到 2032 年市场规模将达到2437亿美元,年复合增长率为 33.6%。

3. AI 技术助力,PC端持续占领市场

3.1 PC 市场开始回暖,需求开始反弹

根据 Canalys 数据,全球 PC 市场在 2023 年第三季度再次出现改善。PC总出货量为 6560 万台,同比下降 7%,但2023 年第二季度相比增长了8%。这是 PC 出货量最小的年度降幅,预示库存水平和潜在需求的复苏。笔记本电脑出货量同比下降 6%,达到 5210 万台;台式电脑出货量下降8%,达到1350 万台。综合来看,PC 市场正在缓慢改善,对应的AMD的显卡、CPU的出货量未来有望会持续提升.

3.2 游戏端显卡略显疲软,AI 助力增长

受到 3 年前“矿潮”的累积的库存、整体宏观经济疲软等多重因素的影响,各大厂商显卡业务板块这几年的营收惨淡,2023Q3 整体的跌势才有所缓解。AMD 在移动端的显卡业务受到行业巨头英伟达的巨大压力,英伟达在移动端的独立显卡市场中占比已经超过了 90%,虽然在价格方面,AMD相较英伟达略有优势,但销量当前与英伟达尚有差距。AMD 当前的策略是借助 PC AI 浪潮,推动未来显卡的发展。业内普遍认为,2024 年有望成为 AI PC 元年。根据 Canalys 的数据,2023 年具备AI 功能的PC 占 PC 总出货量的 10%,到 2027 年这个数字将达到60%。AI PC具有广阔的发展前景。联想集团副总裁、中国首席战略官阿不力克木·阿不力米提表示,考虑到整个产业生态有一个逐步成熟的过程,AI PC首先会经历AIReady 阶段,其中芯片架构率先升级到混合AI 架构,为其他各类特征的加速落地提供本地算力保障,并加速 AI 应用创新。

虽然,AMD 首席财务官胡锦提醒称,AI 应用落地仍需时间,AI 加速处理器最早 2025 年才会推动 PC 销量增长。但是,AMD已经开始进行布局。随着开发人员开始在 Radeon 和 Radeon PRO GPU 上运行ROCm以处理AI和机器学习(Machine Learning)工作,AMD 推出了最新的ROCm5.6。从Radeon RX7900 XTX 和 ProW7900 显卡开始,AMD将为RDNA3消费级显卡提供 ROCm 支持。根据 AMD RX7000 官网的数据,RadeonRX7000系列显卡 AI 性能实现超过 2 倍的提升,最高可达24 GB VRAM,适合于加速本地 AI 工作、处理大型机器学习数据集。

3.3 对标英特尔,客户端持续占领市场

AMD 客户端的处理器主要有三个组成部分,服务器(Server)、台式机(Desktop)、笔记本电脑(Laptop)。服务器的CPU 主要为EYPC霄龙系列芯片,台式机和笔记本电脑 CPU 主要为 RYZEN 锐龙系列。锐龙系列芯片采用AMD ZEN 架构,最新的 CPU 采用 ZEN 4 架构,ZEN5 架构的芯片将于2024年推出。公司客户端持续扩大市占率和营收贡献率。根据AMD和MercuryData 的联合数据,公司 2023 年第三季度消费市场CPU市占率为19.4%,较二季度提高 2.1 个百分点,较去年同期增长4.4 个百分点。营收贡献率环比增长 2.8 个百分点,同比增长 4.8 个百分点。具体到台式机和笔记本电脑,营收占比环比和同比增长迅速,同比增长较快,这一增长大概率系高单价(ASP)的 AMD Ryzen 7000 芯片投入市场所致。

值得关注的是 AMD Ryzen 7000 3D 系列广泛应用了3DV-Cache技术。AMD采用创新的 3D 堆叠技术,可以让 AMD 垂直读取内存,速度达到8-10纳秒,这个速度是使用传统的主板内存(RAM)的10 倍以上,同时实现密度和效能的全面提升。根据 AMD 官方数据,3D V-Cache 技术CPU的互联密度是封装内 2D 小晶片的 200 倍、是凸块 3D 的15 倍、互联效能是凸块3D的3倍。同时,AMD 是目前极少数提供消费级 APU(Accelerator ProcessingUnit)的公司。简单来说,APU 即是将 CPU 和独立GPU 集合封装在一起,以实现效能的提升。公司计划将 Phoenix 和 Phoenix 2 引入桌面,采用Zen4和Zen4c架构,具体型号为 Ryzen 8000G 系列,预计有14 型细分芯片。其中,Ryzen7 8700G 的 RDNA 3 核显拥有 12 个 CU(768 SPs)。

4. 嵌入式系统前景广阔

4.1 FPGA 市场应用前景广阔

FPGA 是公司嵌入式系统中的重要组成部分。FPGA即FieldProgrammableGate Array:现场可编程逻辑门阵列,可以简单的理解为可以自定义计算线路的集成电路。FPGA 可以广泛应用于工业、汽车、国防和航空航天等诸多领域。在 FPGA 邻域,AMD 的主要竞争对手是英特尔, AMD在2022年收购了 FPGA 邻域的龙头赛灵思(Xilinx),正式踏入FPGA赛道。根据 Custom Market Insight 的数据,2023 年FPGA 市场规模约为75亿美元,到 2032 年 FPGA 的市场规模将会达到 142 亿美元,CAGR约为7%,市场增长前景较好。

4.2 AMD 收购赛灵思(Xilinx), 布局长远发展

公司预计未来自适应计算的需求会逐步增加,Xilinx 拥有领先的FPGA、自适应 SoC、人工智能引擎和软件专业知识,公司认为收购赛灵思(Xilinx)是强强联合。根据公司官网信息,在产品方面,赛灵思的加入将能够提供差异化的云端、边缘和智能设备解决方案,同时在加速多样化的新兴负载方面提供支持;在技术方面,赛灵思的加入将扩宽公司在芯片堆叠、3D封装、小芯片等技术方面的提高;在市场方面,公司有望接手赛灵思在有线和无线通信、汽车、工业与测试、航空航天与防务以及测量与仿真等市场深厚的战略合作伙伴资源;财务方面,赛灵思的加入进一步增强了AMD的财务模型,嵌入式系统的收入将已经在营收中体现。2022 年公司嵌入式系统营收 45.52 亿美元,同比增长1750%,营运利润22.52亿美元,营运利润率 50.58%。2023 年 Q3 季度,嵌入式系统收入12亿美元,受通信市场疲软影响同比下降 5%,营运利润率49%,与去年持平。

4.3 嵌入式系统瞄准芯片设计和汽车市场

2023 年 7 月,公司推出了新一代 AMD Versal PremiumVP1902自适应片上系统(SoC),是世界上最大的自适应 SoC。VP1902 容量为上一代的2倍,设计人员可以验证专用集成电路(ASIC)以及SoC 设计。当前人工智能对芯片的能力提出了越来越高的要求,芯片的设计和验证变得越来越复杂,流片之前必须对芯片和软件进行广泛验证。AMD Versal PremiumVP1902仿真和原型设计允功能许设计人员更快的芯片验证,缩短整体流程的时间。设计和调试对下一代芯片至关重要,VP1902 自适应SoC 模拟和制作对下一代产品的原型提供至关重要的帮助。

AMD 车规级 FPGA、自适应 SoC 系统主要由Spartan 7、Zynq7000和ZynqUltraScale+产品系列所组成。伴随汽车先进自动辅助驾驶系统(ADAS)的不断升级,对传感器件数量的要求与日俱增,市场要求更快传输速度、尺寸更小的设备。针对这一市场需求,AMD 推出两款新产品:XAAU10P和XAAU15P,两款产品均达到了车规级标准,并针对型号传输做了优化。XAArtixUltraScale+处理器通过了 ASIL-B 级功能安全认证。根据官网资料,ArtixUltraScale+ FPGA 是业界唯一采用集成扇出(InFO)小型封装的FPGA。相较于芯片级封装,InFO 封装的 Artix UltraScale+尺寸缩小了70%,厚度缩小了73%,可实现业界领先的计算密度,包括单位面积串行I/O带宽和DSP(数字信号处理)计算功能。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3