国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
在众多业内技术评测中,DeepSeek的这款新模型在图像生成基准测试中,超越了OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium等竞品,成为了行业内的新标杆。
采用 MoE 架构,在处理任务时能根据不同的输入激活相应的专家模块,仅激活部分参数就能实现高性能,大幅降低了计算成本,如 DeepSeek-V3 有 6710 亿参数,但仅激活 370 亿参数就可工作。
财联社2月1日讯(编辑 若宇)上周,中国量化巨头幻方量化旗下大模型公司DeepSeek推出了新模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1。