例如,在 AIME 2024 这类数学测试中,DeepSeek-R1-Zero 的 pass@1 准确率从 15.6% 飙升至 71.0%,通过多数投票策略还能进一步提高到 86.7%,水平可与 OpenAI-o1-0912 媲美。
“DeepSeek在基座大模型上做出的突破,是天才级别的。”最近,国产大模型公司深度求索(DeepSeek)引发的舆论震动,让今年春节成为“最有AI味的年”。谈到DeepSeek旗下标志性大模型DeepSeek-R1,多位业内人士向澎湃新闻记者表达了高度赞赏。
DeepSeek开源之后,巨量的协作者涌入,技术边界的探索如火如荼。从长文本到图文等多模态的推理能力,在具身智能领域,谁有机会成为第一个吃DeepSeek螃蟹的人?2月6日,北京大学联合香港科技大学发布了多模态版DeepSeek-R1——Align-DS-V。