昇腾产业链专题分析:昇腾万里,力算未来

您所在的位置:网站首页 minidp转dp支持4k吗 昇腾产业链专题分析:昇腾万里,力算未来

昇腾产业链专题分析:昇腾万里,力算未来

2024-01-09 14:47| 来源: 网络整理| 查看: 265

(报告出品方/作者:华安证券,尹沿技、王奇珏、傅晓烺)

1 昇腾 910 与 310 基础芯片族,自下而上搭建 庞大生态体系

1.1 昇腾 910AI 训练处理器+昇腾 310AI 推理处理器

华为从 2004 年开始投资研发第一颗嵌入式处理芯片,历经 15 年,投入超过 2 万 名工程师,形成了以“鲲鹏+昇腾”为核心的基础芯片族。此外,还有较为边缘的 SSD 控制芯片、智能网卡芯片、智能管理芯片等产品。 为适应 AI 运算的高性能要求,一般认为基础硬件具备至少 64 核、8 个内存通道、 PCIe 4.0、多合一 SoC、xPU 高速互联、100GE 高速 I/O 等六个特征。而支持 64 个核 心的鲲鹏 920 及芯片组能够满足以上要求。

昇腾 310,高能效比推理型 AI 处理器,基于达芬奇架构,本质上是一块 SoC,集 成了多个运算单元,包括 CPU(8 个 a55)、AI Core、数字视觉预处理子系统等。除了 CPU 之外,该芯片真正的算力担当是采用了达芬奇架构的 AI Core。这些 AI Core 通过 特别设计的架构和电路实现了高通量、大算力和低功耗,特别适合处理深度学习中神经 网络必须的常用计算。目前该芯片能对整型数(INT8、INT4) 或对浮点数(FP16)提 供强大的算力。根据海思官网披露,该芯片 FP16 算力为 8TOPS,INT8 算力 16TOPS, 采用 12nm 工艺制造。

昇腾 910,高性能训练 AI 处理器,性能接近英伟达 A100(40GB),半精度(FP16) 算力达到 320 TFLOPS,整数精度(INT8)算力达到 640 TOPS,功耗 310W,采用 7nm 先进工艺。此外,昇腾 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,为构建横向扩展 (Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS 是华为自研的 高速互联接口,片内 RoCE 可用于节点间直接互联。

1.2 开发者套件、加速卡、加速模块,完备的硬件生态

基于昇腾芯片族,华为开发了一系列加速卡产品: Atlas 300T 训练卡,基于昇腾 910 AI 芯片,芯片集成 32 个华为达芬奇 AI Core + 16 个 TaiShan 核,能够提供业界领先的 280 TFLOPS FP16 算力,并集成了一枚 100GE RoCE v2 网卡,支持 PCIe 4.0 和 1*100G RoCE 高速接口,出口总带宽 56.5 Gb/s,无需外置网卡,训练数据和梯度同步效率提升 10%-70%。内存规格方面,包括 32GB 的 HBM 和 16GB 的 DDR4。

Atlas 300T A2 训练卡,强化了高速接口和对 PCIe5.0 的支持,集成 20 个 AI 核、8 个 CPU Core、1*200GE RoCE,提供 280 TFLOPS FP16 算力。

Atlas 300I Pro 推理卡,LPDDR4X 24 GB,总带宽 204.8 GB/s,融合“通用处理 器、AI Core、编解码” 于一体,提供超强 AI 推理、目标检索等功能,具有超强算力、 超高能效、高性能特征检索、安全启动等优势,可广泛应用于 OCR 识别、语音分析、 搜索推荐、内容审核等诸多 AI 应用场景。单卡最大提供 140 TOPS INT8 算力,2 TOPS/W 超高能效比。

Atlas 300I Duo 推理卡,LPDDR4X 48GB,总带宽 408GB/s,从表观上看是两枚 昇腾 310 的组合产品,从算力来看,单卡最大提供 280 TOPS INT8 算力,支持 16 core * 1.9 GHz CPU 计算能力,也约为单芯片的两倍。在此性能基础上,该产品支持 256 路高清视频实时分析。

Atlas 200I DK A2 开发者套件,是一款高性能的 AI 开发者套件,4 核 CPU,可提 供 8TOPS INT8 的计算能力,可以实现图像、视频等多种数据分析与推理计算,可广 泛用于教育、机器人、无人机等场景。以智能小车为例,Atlas 200I DK A2 借助图像处 理神经网络,实现图像识别,基于此实现自动驾驶控制。 Atlas 500 A2 智能小站是面向边缘应用的产品,具有环境适应性强、超强计算性 能、云边协同等特点,可以在边缘环境广泛部署,满足在交通、社区、园区、商场、超 市等复杂环境区域的应用需求。

1.3 服务器: arm 和 x86 兼容,风冷和液冷并用

Atlas 800 训练服务器(型号 9000)是基于华为鲲鹏 920+昇腾 910 处理器的 AI 训练服务器,实现完全自主可控,广泛应用于深度学习模型开发和 AI 训练服务场景。 该服务器面向公有云、互联网、运营商、政府、交通、金融、高校、电力等领域,具有 高计算密度、高能效比、高网络带宽、易扩展、易管理等优点,支持单机和整机柜销售, 支持风冷和液冷应用,满足企业机房部署和大规模数据中心集群部署。 Atlas 800 训练服务器(型号 9010)则是基于华为昇腾 910+Intel V5 Cascade Lake 处理器的 AI 训练服务器,其基于更加成熟的 X86 结构。

Atlas 800 推理服务器 (型号:3000)最大可支持 8 个 Atlas 300I/V Pro,提供强 大的实时推理能力和视频分析能力,广泛应用于中心侧 AI 推理场景。Atlas 800 推理服 务器 (型号:3010)则是基于 Intel 处理器的推理服务器,最多可支持 7 个 Atlas 300I/V Pro,支持 896 路高清视频实时分析,广泛应用于中心侧 AI 推理场景。

集群方面,Atlas 900 PoD 集群基础单元搭载超 32 颗超强算力的鲲鹏 920 处理器, 47U 高度可最大提供 20.4 PFLOPS FP16 AI 算力,采用液冷散热,最大功耗为 46kw。 Atlas 900 AI 集群由数千颗昇腾训练处理器构成,通过华为集群通信库和作业调度 平台,整合 HCCS、 PCIe 和 RoCE 三种高速接口,充分释放昇腾训练处理器的强大 性能。其总算力最大可拓展至 3.2 EFLOPS,全节点 200G 网络互联。这可以让研究人 员更快的进行图像、语音、自然语言等 AI 模型训练,更高效的进行科研探索,加速自 动驾驶的商用进程。

2 AI 生态并非只有 CUDA,各地算力集群建设 快速推进

2.1 AI 算力生态并非只有 CUDA

异构计算架构(CANN)是对标英伟达的 CUDA + CuDNN 的核心软件层,包括引 擎、编译器、执行器、算子库等,承载计算机的单元为 AI 芯片,异构计算架构主要负 责调度分配计算到对应的硬件上。从层级来看,CANN 上承 AI 框架,下接 AI 处理器硬 件,先进的异构架构使得神经网络执行过程的硬件交互时间有效缩短,从而实现对硬件 性能的进一步利用。

在 CANN 的基础之上,昇腾提供了昇思深度学习框架,旨在实现易开发、高效执 行、全场景覆盖三大目标。兼容性上,适配包括昇腾系列产品、英伟达 NVIDIA 系列产 品、Arm 系列的高通骁龙、华为麒麟的芯片等系列产品。 其中,易开发表现为 API 友好、调试难度低;高效执行包括计算效率、数据预处 理效率和分布式训练效率;全场景则指框架同时支持云、边缘以及端侧场景。

丰富的大模型库,目前已经收录「紫东.太初」、「武汉.Luojia」、「鹏程.盘古」、「鹏 程.神农」、「空天·灵眸」等大模型,分别适用于多模态、遥感、中文自然语言、医学、 空天信息化等领域。 以「鹏程.盘古」为例,作为业界首个千亿级参数中文自然语言处理大模型,可支 持知识问答、知识检索、知识推理、阅读理解等丰富的下游应用。该模型由鹏城实验室 为首的技术团队联合攻关,首次基于“鹏城云脑Ⅱ”和国产 MindSpore 框架的自动混 合并行模式实现在 2048 卡算力集群上的大规模分布式训练,训练出业界首个 2000 亿 参数以中文为核心的预训练生成语言模型。鹏程·盘古α预训练模型支持丰富的场景应 用,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出,具备很强 的小样本学习能力。 模型基于国产全栈式软硬件协同生态(MindSpore+CANN+昇腾 910+ModelArts)。

2.2 智算中心建设快速推进,全国算力网络正在形成

武汉人工智能计算中心基于昇腾 AI 基础软硬件建设,于 2021 年 5 月 31 日正式竣 工并投入运营,上线即算力资源满负荷使用。于 2022 年 2 月 7 日完成扩容,总算力达 200P,并再次饱和运营。 西安未来人工智能计算中心于 2021 年 5 月正式启动建设,建设周期近四个月,于 2021 年 9 月 9 日正式上线运营,一期包含 AI 算力 300P、HPC 算力 8P。 中原人工智能计算中心,基于“黄河鲲鹏+昇腾技术”底座,是中原地区人工智能 产业的重大算力支持基础设施。项目总投资 10 亿元,于 2021 年 10 月 21 日正式上线。 一期建设规模为 100P AI 算力,未来将达到 300P AI 算力。截止到 2022 年底,该中心 服务中原企业客户 60 余家,高校学院客户 30 余家,科研单位 10 余家,同时还有省外 活跃客户百余家,平均算力使用率在 90%左右。

南京人工智能计算中心,基于南京市委市政府的产业规划,以及华为与江北新区共 建昇腾产业的合作协议,南京人工智能计算中心于 2022 年 5 月完成基础平台建设,一 期规划 40P 算力,上线即接近饱和,当前平均算力使用率在 95%以上。截止到 2022 年 12 月,算力中心的应用已初具规模,已与 200 多家合作伙伴推出超过 150 多个人工 智能解决方案。 成都智算中心包括算力达 300P 的人工智能算力平台,以及城市智脑平台和科研创 新平台,目前是西南地区最大的人工智能计算中心。正式运营以来,中心已经与 80 余 家企业及科研团队展开合作,平均算力利用率达到 85%以上,实现上线即饱和运营。 杭州人工智能计算中心,一期面积 2000 平方米,一期规模 40P,二期扩容后总规 模将达到 140P。计算中心采用自主可控的昇腾 AI 集群,为政府、企业、科研机构、高 校等提供公共普惠算力。该中心已于 2022 年 5 月 20 日在杭州市滨江区海创基地上线。

3 昇腾伙伴网络,五类定位构建产业矩阵

3.1 整机硬件伙伴:传统服务器大厂+新锐硬件加工厂商

对于整机硬件合作伙伴,昇腾社区对此有明确的定义:拥有自有品牌产品,能在昇 腾产品基础上二次开发或加工生产,并销售与服务至最终用户的合作伙伴。 从官网标注的级别来看,主要分为领先级、优选级和认证级。其中包括服务器行业 领先企业宝德、新华三、清华同方等,也包括 2020 年成立的华鲲振宇等新锐企业或生 产主体,以及神州数码等和华为长期保持合作关系的渠道端重点企业。其中部分合作伙 伴已经实现鲲鹏系列服务器的量产出货,具备长期定制化服务器的生产能力。

高度细化的定级标准,进一步印证市场规模。昇腾官方公布了不同级别的整机硬件 合作伙伴认证标准,其中对战略级、领先级、优选级合作伙伴市场规模要求为大于等于 20 亿、10 亿、5 亿,营销活动大于等于 12、8、6 次每年。以上要求一方面释放出昇 腾交易规模和市场体量的发展趋势,另一方面也说明了昇腾正致力于发力市场营销和产 品打造。 此外,不同级别合作伙伴在价格优惠政策方面也存在进阶差异,更高级别能够获得 更优惠的价格政策,以及华为展厅展示等权益。

目前,昇腾整机硬件大致可以分为训练型服务器和推理型服务器两大类。 训练型服务器方面:以宝德 PR420 为例,该机为四路鲲鹏训练服务器,搭载 4 枚 鲲鹏 920 高性能通用处理器(基于 ARM v8),8 张昇腾 910 系列训练加速卡,并支持 2 个 PCIe 4.0 扩展插槽。该机具有最强算力密度、超高能效与高速网络带宽等特点。 该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、 石油勘探等需要大算力的行业领域。

推理型服务器方面:以长江计算 G220K V2 为例,该机型搭载基于昇腾 310 的 Atlas300I Pro 推理卡,最大支持 8 张,CPU 方面则选用两枚鲲鹏 920,相比训练机型 对于性能的高规格,推理机型更加注重能效比和成本控制。Atlas 300I Pro 单卡功耗仅 72W,为 Al 服务器算力加速同时提供更优的能效比。在 8 张 Atlas 300I Pro 推理卡的 支持下,整机可提供 1024 路高清视频实时分析 (1080P 分辨率 30FPS)。

3.2 IHV 硬件伙伴:边缘计算赋能千行百业

IHV 硬件厂商主要涉及边缘运算硬件,用于工控终端、数据采集、嵌入式智能计算 等场景,并已经出现较大规模的场景落地。根据昇腾官网对 IHV 合作伙伴的定义,即 能够基于华为昇腾部件进行二次开发,形成自有品牌硬件产品并进行销售的硬件伙伴。

以昇腾优选级伙伴凌华科技为例,其边缘计算盒子采用置华为昇腾 Atlas 200 AI 智 能计算模组,集成高性能 Ascend 310 AI 处理器,可实现图像、视频等多种数据分析与 推理计算,可广泛用于智能制造、安防、智慧交通、机器人、无人机等边缘计算应用场 景。以餐饮领域为例,一台边缘盒子可采集多路视频监控,并对图像进行实时分析,识 别出不规范行为并将其上报给管理侧。

3.3 应用软件伙伴:电力与智慧城市等场景国产化落地

应用软件伙伴:开发、销售自有知识产权的应用程序、软件、垂直细分应用等产品, 能对接昇腾产品,有能力二次开发的软件伙伴。目前来看,主要涵盖智慧城市、智慧交 通、电力信息化等领域,有助于推动关键领域的硬件国产化,合作伙伴包括:华雁智科、 以萨、云天励飞、格灵深瞳、云从科技、智洋创新等。

以萨视频图像全目标结构化解决方案,对海量视频数据实施高效、全目标、一体化 解析,充分挖掘数据价值,赋能交通管理、市域治理等领域的多场景实战应用。基于昇 腾 AI,该方案让视频图像数据分析处理能力由原来的 20 路提升到现在的 60 路,实现 3 倍性能提高,达到业界领先水平。

4 昇腾产业链相关企业梳理

4.1 神州数码:华为老牌合作伙伴,AI 服务器产品先行者

神州数码于 2020 年建成首个鲲鹏超算中心(厦门),旗下鲲泰系列产品契合国内 企业信创需求,并完成了对国产中间件、数据库、操作系统的适配,多次中标项目彰显 行业竞争力。 “鲲鹏+鲲泰”布局国产设备赛道,核心技术解决“卡脖子”问题。2020 年初,公 司加入华为鲲鹏生态系,加速布局和升级自有品牌“神州鲲泰”从而打造“鲲鹏+鲲泰” 系列产品。借力鲲鹏,公司服务器产品计算能力以及耗能处于国产化 CPU 标杆水平。 2022 年公司发布神州鲲泰人工智能推理服务器,以“鲲鹏+昇腾”为核心,可提供 128 个处理核心的算力,同时最大可支持 8 张华为 Atlas 300 推理卡。目前神州数码已取得 各行业数字化解决方案和人工智能数字化解决方案的实践案例,在未来,其核心技术加 速推动信创产品的发展。

信创产品持续中标,品牌影响力逐步提升。神州信创产品定位是:“华为鲲鹏 CPU” 为核心,以自身丰厚行业应用案例为辅助,构建自身信创产品生态,搭建各行业应用平 台。神州数码连续赢得“国家税务总局 2021 年税务系统线上批量集中采购计算机设备 补充入围项目”、 “厦门集美区鲲鹏等信创适配服务运营”、“中国移动 2021 年至 2022 年人工智能通用计算设备集中采购”、“中国移动 2021 年至 2022 年 PC 服务器集中采 购”项目等。

股权激励明确业绩前瞻,高增速凸显投资价值。1)IT 分销业务方面,公司继续践 行“数字中国”之理想,以生态体系为依托,紧抓行业热点机遇,聚合更多的厂商和合 作伙伴,为客户提供更全更优的产品、方案和服务,在持续推动分销业务复合增长的同 时,赋能产业数字化转型和数字经济发展。2)云服务方面,神州数码以构建云原生为 基础,打造开源化能力,向下聚合,向上服务于应用转型管理,打造包括云管理服务 (MSP)、数字化解决方案(ISV)、视频云产品及服务等数字化服务。3)对于信创服 务方面,神州数码坚持自主创新、生态聚合推出神州鲲泰系列产品,并迅速在政企、金 融、运营商、互联网、交通、能源等多个行业取得突破落地。

4.2 同方股份:自主可控守门员,昇腾产品覆盖广泛

2022 年 4 月 16 日,同方计算机与华为技术有限公司在京举行昇腾万里伙伴授牌仪 式,同方正式成为昇腾整机硬件合作伙伴,并签署 Powered by Ascend (PBA) 品牌授 权协议,共同推进人工智能产业繁荣发展。 从产品分布来看,训练型、推理型服务器均有涉及,搭配 cpu 包括鲲鹏、飞腾、 英特尔系列,以 2U 服务器为主。此外,同方也已推出了基于鲲鹏的个人计算机、储存 型服务器、通用型服务器等一系列产品,形成了完备的产品矩阵。

4.3 科大讯飞:星火一体机,讯飞星火将与昇腾 AI 强强联合

星火一体机可私有化部署大模型,实现专属、安全、自主可控。今年 7 月 6 日, 科大讯飞公布讯飞星火将与昇腾 AI 强强联合,打造基于中国自主创新的通用智能新底 座。此次发布会,科大讯飞与华为再度合作,联合发布星火一体机,让企业可以在国产 自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。 该设备可提供对话开发、任务编排、插件执行、知识接入、提示工程等 5 种定制优 化模式,以及办公、代码、客服、运维、营销、采购等 10 种以上即开即用的丰富场景 包,支持 3 种模型尺寸供用户选择。刘庆峰表示,有了这些能力,就可以使得每一家企 业、每一个行业、每一所学校、每个医院都有机会构建自己的专属大模型。目前,讯飞 星火已完成的在金融、政务、汽车等领域的 9 个专属大模型的数据显示,在场景任务优 化和私域知识增强等方面平均效果能够提升 20%。

4.4 润和软件:智能物联领域的昇腾 AI 落地

润和软件打造的危化品存储室智能安全管控解决方案借助于昇思 MindSpore AI 框 架快速训练视觉算法模型,集成华为昇腾强大 AI 算力与润和智能视觉分析引擎,快速 落地作业安全规范的智能化。对防护要求、作业流程等纸质化规范进行智能化改造,预 防此期间可能发生的违规操作,为作业人员的安全提供坚实保障。 润和软件提供的智能安全管控解决方案,在规定的监管区域内,进行人员检测,并 检查作业人员装备规范性,包括作业服、呼吸器、氧气面罩等,同时分析穿戴序列,对 作业时间进行监管。目前,该方案已经实现规模化应用,在某石化企业上线后,迅速将 其月均违规作业次数降为 0。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3