近期,杭州深度求索人工智能(AI)基础技术研究有限公司(DeepSeek)先后上线大语言基座模型DeepSeek V3,以及基于V3训练、专为复杂推理任务设计的DeepSeek R1模型,并同步开源。它们以卓越的性能超越或媲美了全球顶级的开源及闭源模型。
作 者丨孔海丽、赵云帆编 辑丨朱益民DeepSeek火成了现象级,中国公司在全球AI竞技场投下一枚"算法裂变弹"。当硅谷巨头们仍在算力军备竞赛中重兵鏖战,中国工程师用"更聪明、更便宜、更开放"的三重创新公式,在算法效率、开源生态与能耗成本三个维度同步撕开突破口。
春节至今,DeepSeek持续刮起“最炫民族风”。2月5日A股复盘首日,人工智能概念公司股价齐奔涨停。DeepSeek持续站在全世界的聚光灯下,本质原因可以归纳为两个。其一是低成本。从OpenAI发布o1-preview至今,市场上可以媲美甚至超越其性能的推理模型已遍地开花。
DeepSeek,这家公司你听说过吗?它就像一颗突然闪耀的星星,迅速点亮了中国乃至全球的AI领域。DeepSeek-R1-Zero的训练方法更是让人眼前一亮,它大幅降低了训练成本,仅仅花费了557.6万美元,这比起动辄上千万美元的其他顶尖模型,简直是性价比之王!