华为的昇腾910芯片在多个方面表现出色:1. 算力强大:升腾910采用了华为自研的达芬奇架构,是目前算力最强的芯片之一,其半精度算力可达320TFLOPS,整数精度算力可达640TOPS,功耗仅为310W。
昇腾 910 达到了设计规格,在同等功耗下拥有的算力资源,达到了业内最佳水平的2倍这样,它已经应用在实际 ResNet50 网络的训练中服务器中, 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升非常强大,每秒处理的图片数量从 965 张提升到了 1800张。
基于昇腾芯片族,华为开发了一系列加速卡产品: Atlas 300T 训练卡,基于昇腾 910 AI 芯片,芯片集成 32 个华为达芬奇 AI Core + 16 个 TaiShan 核,能够提供业界领先的 280 TFLOPS FP16 算力,并集成了一枚 100GE RoCE v2 网卡,支持 PCIe 4.0 和 1*100G RoCE 高速接口,出口总带宽 56.5 Gb/s,无需外置网卡,训练数据和梯度同步效率提升 10%-70%。
IDC 预计,全球人工智能服 务器市场,将从 2022 年的 195 亿美元增长到 2026 年的 347 亿美元,五年年复合增 长率达 17.3%;2023 年 6 月,公司收购艾 普阳深圳 52%股权。
和讯财经<<<点击左侧,下载和讯财经APP,免费领取和讯Plus会员,畅读全市场投资干货:8大财经栏目,最新最热资讯独家行情解读,快人一步掌握市场投资风向。券商看点:随着新一轮对华芯片出口限制的开启,国产AI算力迎来了重大机遇。
其部署不仅需要高性能服务器集群和PB级存储系统,更对算力提出极致要求:极致显存消耗:旗舰型号DeepSeek-R1在FP16模式下显存需求高达1.7TB,相当于同时加载340部4K电影,单次推理需多台顶级AI服务器协同作战。