近期,杭州深度求索人工智能(AI)基础技术研究有限公司(DeepSeek)先后上线大语言基座模型DeepSeek V3,以及基于V3训练、专为复杂推理任务设计的DeepSeek R1模型,并同步开源。它们以卓越的性能超越或媲美了全球顶级的开源及闭源模型。
作 者丨孔海丽、赵云帆编 辑丨朱益民DeepSeek火成了现象级,中国公司在全球AI竞技场投下一枚"算法裂变弹"。当硅谷巨头们仍在算力军备竞赛中重兵鏖战,中国工程师用"更聪明、更便宜、更开放"的三重创新公式,在算法效率、开源生态与能耗成本三个维度同步撕开突破口。
春节至今,DeepSeek持续刮起“最炫民族风”。2月5日A股复盘首日,人工智能概念公司股价齐奔涨停。DeepSeek持续站在全世界的聚光灯下,本质原因可以归纳为两个。其一是低成本。从OpenAI发布o1-preview至今,市场上可以媲美甚至超越其性能的推理模型已遍地开花。