amd没有cuda如何跑模型

资讯

1530亿个晶体管！AMD携最强AI芯片叫板NVIDIA：单芯片可跑大模型
6月14日消息，处理器大厂AMD在美国旧金山举行的 “数据中心与人工智能技术发布会”，正式发布了新一代的面向AI及HPC领域的GPU产品——Instinct MI 300系列。
芯智讯
22评论
AMD推新款GPU直指大模型市场，英伟达还能一家独大吗？
界面新闻记者 | 彭新界面新闻编辑 | 在英伟达凭借其GPU（图形处理器）赢得AI计算市场绝大部分份额之际，另一大GPU巨头AMD何时推出有竞争力的产品，成了行业普遍关心的话题。如今，后者终于给出正面回应。
界面新闻
A卡跑大模型性能达4090的80%，价格只有一半：陈天奇TVM团队出品
通过这种优化方法，在最新的 Llama2 的 7B 和 13B 模型中，如果用一块 AMD Radeon RX 7900 XTX 速度可以达到英伟达 RTX 4090 的 80%，或是 3090Ti 的 94%。
机器之心Pro
10评论
叫板英伟达，AMD真的YES？
沉寂已久的服务器领域近乎开了场春晚，之所以这么引人关注，还是因为今年大火的ChatGPT将人工智能再度推上风口浪尖，英伟达GPU变成AI玩家们争夺算力的抢手金砖，A100价格从去年12月一路上涨，5个月价格累计涨幅达到37.5%，同期其阉割版的A800价格累计涨幅达20.0%。
芯片超人
生死看淡，不服就干！AMD正式发布ROCm 6.0，剑指英伟达CUDA
长期以来，AMD的显卡销量一直被英伟达所吊打，双方差距非常悬殊，这两年差距甚至还有越拉越大的趋势，很多朋友不理解这是为什么。
宗熙先生
42评论
【万字硬核实录】陈天奇：A卡跑大模型，iphone跑70B，打爆英伟达GPU算力困境
不过，如果我们可以用A卡代替N卡，甚至不需要GPU就可以训练大模型，一切又会发生怎样的变化呢?通过这种优化方法，在最新Llama2的7B和13B模型中，用一块AMD Radeon RX 7900 XTX，速度已可达到英伟达RTX 4090的80%，或是3090Ti的94%。
华尔街见闻
太简单了！全免费！最简单、省事的3分钟上手 AMD 显卡 AI 跑图教程！
今年以来，PC业界最大的风口毫无疑问就是“AI”了，从年初的Stable Diffusion AI绘画到后来的ChatGPT，仿佛一夜之间PC里沉寂已久的庞大算力找到了出头之日，各路热点关注纷纷涌向AI计算，各厂商一夜之间纷纷推出自己的模型，显卡价格暴涨，随后迎来制裁...
云评测专家
15评论
Deepseek还能再次重创英伟达？想多了，Deepseek目前还没绕开CUDA
即使是Deepseek 的 V3 模型训练，DP的研究人员在英伟达 H800 GPU 的 132 个流式多处理器中，专门分配 20 个用于服务器间的通信任务，以突破处理器互联带宽限制，加快数据传输速度。
奈何佳作
499评论
CUDA护城河，太难跨越了
AMD 应该与 Meta 合作，让生产训练工作负载在 ROCm 上运行，因为 PyTorch 用户都知道，除非 Meta 在内部使用 PyTorch 代码路径，否则它往往会有大量错误。
半导体行业观察
46评论
硅谷视角深聊：Deepseek的颠覆、冲击、争议和误解
硅谷101在春节期间组成了五人小分队，访问了数十位嘉宾，想从技术、资本、市场等等多个纬度来聊聊DeepSeek:1. DeepSeek的技术创新在哪里?
钛媒体APP

视频