编辑:庸庸 好困【新智元导读】在Meta的Llama 3.1训练过程中,其运行的1.6万个GPU训练集群每3小时就会出现一次故障,意外故障中的半数都是由英伟达H100 GPU和HBM3内存故障造成的。随着大模型的迭代,其GPU用量也在不断增长。
上周,英伟达发布了GeForce Game Ready 531.18 WHQL驱动程序,最主要的更新就是增加了对RTX Video Super Resolution技术的支持,使用GeForce RTX 30/40系列显卡的用户可以率先享受这一功能,但根据部分玩家和外媒的反馈,该版本驱动会导致空闲时CPU占用率过高的问题。
曾经接连被英特尔、高通等巨头拒绝合作,如今比英特尔、高通等市值加起来还要高,这一科技界逆袭爽文的主角,就是当下备受全球瞩目的英伟达。逆袭的关键,就在于英伟达GPU的发明和不断升级,当下AI、芯片领域最为火爆的话题也跟它有关,英伟达最新一代的Blackwell GPU。
今天, NVIDIA发布了最新的GeForce 364.96热修复驱动,修复了P-state BUG引起了显卡性能下降问题,并添加了对《DOOM(毁灭公爵)》公测版的支持。本次的热修复驱动支持Windows Vista/7/8/8.
下面就让我们来看看本场GTC大会的完整干货:1、H100 GPU:采用台积电4N工艺,拥有800亿个晶体管,实现了首个GPU机密计算,相比A100,FP8性能提升6倍,FP16、TF32、FP64性能各提升3倍。