有了高效的分布式训练框架,自然也需要优化的分布式训练集群。NVIDIA DGX SuperPOD 便是 NVIDIA 推出的一个分布式集群的参考架构,最新一代是基于NVIDIA DGX A100 和NVIDIA HDR 200Gb/s ConnectX-6 HCAs组建,旨在帮助AI 研究人员快速搭建一套强大、灵活、高效的系统,以满足工业界日益复杂、多变的模型对计算资源不同程度的需求。
上海人工智能实验室(上海AI实验室)面向全球招聘大模型人才。实验室现已推出书生大模型体系,涵盖书生·浦语、书生·万象通用基础模型及多个垂直领域专用模型。同时,实验室构建了大模型评测体系(司南OpenCompass),以纯粹技术及中立视角,为业界提供能力指标参考和优化方向指引。
随着ChatGPT爆火出圈,狂飙之势从22年底持续到23年初,与以往的技术突破不同的是,此次的大模型不仅被技术界关注,而且备受投资界、产业界和大众消费者的追捧,使它成为历史上最快月活过亿的现象级应用,继而引发全球科技巨头的AI竞赛。