来源:转载机器之心报道机器之心编辑部今天,一个国产大模型火遍了世界。打开 X,满眼都是讨论 DeepSeek-V3 的推文,而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.
科普中国 今年春节期间,一颗来自杭州的“AI 新星”悄然崛起,它的名字叫 DeepSeek。它就像一道突如其来的闪电,不仅点亮了全球 AI 的夜空,更为开源社区带来了一股神秘的“东方力量”。随着 DeepSeek 火出圈,越来越多的人开始使用这个 AI 神器。