界面新闻记者 | 彭新界面新闻编辑 | 在英伟达凭借其GPU(图形处理器)赢得AI计算市场绝大部分份额之际,另一大GPU巨头AMD何时推出有竞争力的产品,成了行业普遍关心的话题。如今,后者终于给出正面回应。
通过这种优化方法,在最新的 Llama2 的 7B 和 13B 模型中,如果用一块 AMD Radeon RX 7900 XTX 速度可以达到英伟达 RTX 4090 的 80%,或是 3090Ti 的 94%。
沉寂已久的服务器领域近乎开了场春晚,之所以这么引人关注,还是因为今年大火的ChatGPT将人工智能再度推上风口浪尖,英伟达GPU变成AI玩家们争夺算力的抢手金砖,A100价格从去年12月一路上涨,5个月价格累计涨幅达到37.5%,同期其阉割版的A800价格累计涨幅达20.0%。
不过,如果我们可以用A卡代替N卡,甚至不需要GPU就可以训练大模型,一切又会发生怎样的变化呢?通过这种优化方法,在最新Llama2的7B和13B模型中,用一块AMD Radeon RX 7900 XTX,速度已可达到英伟达RTX 4090的80%,或是3090Ti的94%。
今年以来,PC业界最大的风口毫无疑问就是“AI”了,从年初的Stable Diffusion AI绘画到后来的ChatGPT,仿佛一夜之间PC里沉寂已久的庞大算力找到了出头之日,各路热点关注纷纷涌向AI计算,各厂商一夜之间纷纷推出自己的模型,显卡价格暴涨,随后迎来制裁...
即使是Deepseek 的 V3 模型训练,DP的研究人员在英伟达 H800 GPU 的 132 个流式多处理器中,专门分配 20 个用于服务器间的通信任务,以突破处理器互联带宽限制,加快数据传输速度。