21世纪经济报道记者倪雨晴 深圳报道开年的AI圈,可真是热闹。DeepSeek激起千层浪。一边是硅谷、华尔街都在激辩DeepSeek的影响;另一边,科技巨头已经下场无缝连接DeepSeek-R1模型服务。
DeepSeek的V3模型仅用557.6万的训练成本,实现了与OpenAI O1推理模型相近的性能,这在全球范围内引发连锁反应。由于不用那么先进的英伟达芯片就能实现AI能力的飞跃,英伟达在1月27日一天跌幅高达17%,市值一度蒸发6000亿美元。
英伟达网站显示,DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。英伟达网站介绍称,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。
时谦 英伟达也认可了!据英伟达官网最新消息,为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。
尽管国产大模型公司深度求索(DeepSeek)使得AI(人工智能)芯片龙头英伟达股价暴跌,但英伟达依然给出高度评价。当地时间1月27日,英伟达发言人表示:“DeepSeek是AI领域的一项卓越进步,也是测试时间缩放(Test Time Scaling)技术的完美范例。
1月31日,英伟达网站显示,DeepSeek R1 671b已作为英伟达NIM微服务预览版在build.nvidia.com上发布。DeepSeek R1 NIM微服务在单个英伟达HGX H200系统上每秒最多可处理3872个token。