在专业的大模型排名 Arena 上,DeepSeek - R1 基准测试成绩斐然,已升至全类别大模型第三 ,其中在风格控制类模型 分类中与 OpenAI o1 并列第一,竞技场得分达到 1357 分,还略超 OpenAI o1 的 1352 分。
目前,第一类卷向大参数的玩家也都在寻找高效解决方案,连 OpenAI 此前发布 GPT-4o mini 切入小模型市场,Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。