在OpenAI没有披露o1具体技术的情况下,只用了2个月左右的时间,国内大模型公司就跟上了前沿方向的能力:11月16日,月之暗面在发布会上公开了新模型k0 math,通过采用强化学习和思维链推理技术,大模型开始试图模拟人类的思考和反思过程,从而增强其数学推理能力。
海报新闻记者 赵恩 上海报道近日,有着“AI界的拼多多”之称的深度求索发文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。深度求索表示,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。
《中国经济周刊》 记者 郑雪 | 北京报道从一段文字变成一个视频,需要多长时间?答案或许是10秒。借助AI大模型,你只需要输入需求描述,可能只需等待10秒,便能得到想要的视频,而且花费很低甚至是免费的。10秒背后,不仅是技术进步,更是大模型“钞能力”的结果。