这几天,中国人工智能初创公司DeepSeek火了,不仅在美区下载榜上超越了ChatGPT,还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。为何DeepSeek的出现会让美国如此关注,甚至有些紧张?
性能评估结果显示,通过纯强化学习方法训练得到的 DeepSeek-R1-Zero以及在此基础上改进的 DeepSeek-R1,在 2024 年AIME测试中分别取得了 71.0% 和 79.8% 的成绩,与 OpenAI o1 的79.2%水平可谓并驾齐驱。
“DeepSeek在基座大模型上做出的突破,是天才级别的。”最近,国产大模型公司深度求索(DeepSeek)引发的舆论震动,让今年春节成为“最有AI味的年”。谈到DeepSeek旗下标志性大模型DeepSeek-R1,多位业内人士向澎湃新闻记者表达了高度赞赏。
【军武次位面】作者:天狼当中国“六代机”的横空出世让西方媒体集体“装死”时,一款AI模型DeepSeek却在全球掀起了前所未有的轰动。它不仅让美国主流媒体各种“周末加班、连夜报道”,更有甚者,将其与苏联发射“斯普特尼克1号”卫星时的震撼相提并论。这背后究竟隐藏着怎样的技术突破?