DeepSeek 颠覆了 AI 领域,挑战 OpenAI 的主导地位,推出了一系列先进的推理模型。该精简版 DeepSeek-R1 模型是通过在 DeepSeek-R1 生成的数据上微调 Llama 3.1 8B 模型而创建的。
例如,在 AIME 2024 这类数学测试中,DeepSeek-R1-Zero 的 pass@1 准确率从 15.6% 飙升至 71.0%,通过多数投票策略还能进一步提高到 86.7%,水平可与 OpenAI-o1-0912 媲美。
来源:环球网 【环球网科技综合报道】2月11日消息,紫光股份旗下新华三集团发布基于DeepSeek大模型的一体机UniCube,全面搭载DeepSeek V3、R1模型,并实现671B DeepSeek大模型单机推理及单机训推一体服务。