来源:转载机器之心报道机器之心编辑部今天,一个国产大模型火遍了世界。打开 X,满眼都是讨论 DeepSeek-V3 的推文,而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.
诸位观众老爷,烦劳您点个关注。您的认可实乃对我莫大的支持!事件经过1 月 27 日,一则“DeepSeek 应用超越 ChatGPT,荣登苹果美国区免费 App 下载排行榜榜首”的讯息犹如平地惊雷,瞬间在市场中掀起轩然大波。