来源:【海报新闻】海报新闻记者 赵恩 上海报道近日,有着“AI界的拼多多”之称的深度求索发文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。深度求索表示,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。
界面新闻记者 | 伍洋宇 李彪界面新闻编辑 | 文姝琪2024年底,DeepSeek(深度求索)再次凭借模型性能在行业中掀起一个小高潮。这家独立于大模型“六小虎”格局之外、不容行业所忽视的公司,发布了新一代MoE模型DeepSeek-V3首个版本并同步开源。
近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏!12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。
财联社2月1日讯(编辑 若宇)上周,中国量化巨头幻方量化旗下大模型公司DeepSeek推出了新模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1。