n卡启用Transformer模型

资讯

NVIDIA Megatron：超大Transformer语言模型的分布式训练框架 (二)
有了高效的分布式训练框架，自然也需要优化的分布式训练集群。NVIDIA DGX SuperPOD 便是 NVIDIA 推出的一个分布式集群的参考架构，最新一代是基于NVIDIA DGX A100 和NVIDIA HDR 200Gb/s ConnectX-6 HCAs组建，旨在帮助AI 研究人员快速搭建一套强大、灵活、高效的系统，以满足工业界日益复杂、多变的模型对计算资源不同程度的需求。
NVIDIA英伟达中国
计算机视觉中的transformer模型创新思路总结
前言本文回顾了ViT的结构，总结了计算机视觉中的transformer的主要改进思路:改进分块，改进位置编码，改进Encoder，增加Decoder。
极市平台
11评论
Hugging Face + ONNX：Transformer模型推理速度提升秘籍
今天就给大家分享下用Hugging Face和ONNX加速Transformer模型推理的骚操作。ONNX，Open Neural Network Exchange的缩写。
溜溜达达
3评论
熬了一晚上，我从零实现了Transformer模型，把代码讲给你听
自从彻底搞懂Self_Attention机制之后，笔者对Transformer模型的理解直接从地下一层上升到大气层，任督二脉呼之欲出。于是在肾上腺素的驱使下，笔者熬了一个晚上，终于实现了Transformer模型。
极市平台
14评论
什么是 Transformer 模型（二）
如果想在 AI 领域引领一轮新浪潮，就需要使用到 Transformer。尽管名为 Transformer，但它们不是电视银幕上的变形金刚，也不是电线杆上垃圾桶大小的变压器。
NVIDIA英伟达中国
7评论
“Super”赋能 NVIDIA Jetson Orin Nano 开发者套件实现性能飞跃
全新 Jetson Orin Nano Super 开发者套件做出了以下改进:生成式 AI 性能提升至 1.7 倍。适用于 Jetson Orin Nano 和 Orin NX 模组的性能升级支持和文档将于 1 月上半月随 JetPack 6.1.1 一起发布。
NVIDIA英伟达中国
1评论
阿里安全使用NVIDIA加速库的大模型工程落地实践
【1】图二. 引用自:Samyam Rajbhandari， Jeff Rasley， Olatunji Ruwase， Yuxiong He. ZeRO: Memory Optimizations Toward Training Trillion Parameter Models . arXiv: 1910.02054v3 ， 2020-05-13.
芯东西
1评论
DLSS 4加持的超强猛卡！RTX 5090 D纯白王者登场 AORUS GeForce RTX 5090 D MASTER ICE超级雕首发测评
NVIDIA在CES 2025上正式发布了采用全新Blackwell架构的RTX 50系列GPU，而其中的旗舰RTX 5090 D终于在1月24日迎来了性能解禁。
电脑报

视频