南方财经全媒体记者 吴立洋 上海报道近日,南方财经全媒体记者注意到,国内诸多主流公有云服务商,均出现一定程度云端GPU算力缺货的情况。有下游GPU需求方向记者表示,近期受AI热潮影响,GPU云服务市场确实存在短期内供不应求的情况。
AI浪潮来袭,算力需求爆发。国内AI服务器厂商和各类芯片企业无不积极拥抱这场巨大变革。“单个GPU已经无法跑Transformer、BERT、GPT这些大模型,需要几百个甚至上千个GPU连在一起才能跑起来。
来源:环球时报 自人类踏入工业社会以来,对某种资源的需求可能从未有过如此迅猛的增长。 有统计显示,在人工智能(AI)时代,对算力的需求每隔两个月就要翻倍。相关数据显示,到2030年,智能算力相比2020年将增长500倍。
其中明确将性能、密度作为出口管制标准,将单芯片超过300teraflops算力,以及性能密度超过每平方毫米370 gigaflops的芯片都纳入了禁止出口行列。虽然在这一禁令下,AMD、英特尔等公司提供的高端AI芯片也受到影响。
来源:环球时报 【环球时报报道 记者 马俊】伴随着人工智能(AI)技术的高速发展,包括OpenAI公司CEO山姆·奥特曼在内的业内人士都开始担心,它将被能源问题“卡脖子”,因为AI当前面临的现实难题之一就是能源和智能的转化效率。
根据最新爆料,NVIDIA专为中国市场推出的RTX 5090D显卡除了削减Tensor AI算力外,还有其他一系列限制。爆料称,RTX 5090D的一个重大限制是在AI和挖矿相关应用中会锁算力,当GPU运行相关工作超过3秒时,会自动锁定性能,可能是降低频率或通过软件进行性能限制。