在探索人工智能的浩瀚征途中,寻求高效且经济的训练模型始终是科研人员不懈努力的方向。DeepSeek-V3,作为这一领域的璀璨明星,以其独树一帜的低成本训练策略,为AI技术的革新与发展开辟了崭新的道路。低成本训练的革命在人工智能领域,高效且低成本的训练模型一直是研究者们追求的目标。
海报新闻记者 赵恩 上海报道近日,有着“AI界的拼多多”之称的深度求索发文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。深度求索表示,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。
2024年的末梢,AI领域的热度依旧。如果说美国市场OpenAI的一分为二扫清了其亦公益亦商业的障碍,“量子英伟达”RGTI的狂飙揭示了市场对量子计算世界的期待,那么12月26日深度求索宣布上线并同步开源DeepSeek-V3模型,则再次让人们看到国内AI领域一样精彩。