近日,量化巨头幻方量化的子公司深度求索(DeepSeek)发布了全新系列模型DeepSeek-V3,并同步开源。这一事件迅速引爆AI圈,DeepSeek-V3不仅霸榜开源模型,更在性能上与全球顶尖闭源模型GPT-4o和Claude-3.5-Sonnet不相上下。
去年12 月,DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能,震惊了业界。
海报新闻记者 赵恩 上海报道近日,有着“AI界的拼多多”之称的深度求索发文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。深度求索表示,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。
在性能表现方面,DeepSeek - V3能与GPT - 4等顶尖模型相媲美,Janus - Pro - 7B在GenEval和DPG - Bench基准测试中击败OpenAI的DALL - E 3等模型。
深度求索(DeepSeek)创始人梁文锋(央视《新闻联播》视频截图)在2025年1月20日举行的专家、企业家和教科文卫体等领域代表座谈会上,一位“85后”广东小伙引起众人瞩目。之后,他创立的DeepSeek的搜索量不断攀升,撼动全球AI圈。