想站稳脚跟,不能走捷径。在大模型“撞墙论”不绝于耳的当下,行业比任何时候都更为迫切地渴求探索、渴求创新。步入2025年这短短一个月之内,全球大模型玩家仿佛集体“冲业绩”,OpenAI、谷歌、DeepSeek等玩家密集发布了一系列新品。
国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
1月15日,澎湃科技(www.thepaper.cn)获悉,AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)发布并开源新一代01全新系列模型。该系列模型包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
2024 年春节尚未结束之时,Sora 横空出世,由此拉开了大模型多模态大战的序幕。与之相对应的是摒弃预训练、微调之风渐起,OpenAI 前首席科学家 Ilya Sutskever 直言“预训练即将终结”。
过年期间爆火的DeepSeek是什么?DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型和相关技术。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”。
本报记者 吴清 北京报道一股来自东方的神秘力量,在春节期间不仅刷爆了朋友圈,搅动了美国的科技圈,也吸引了全球的关注和热议。2025年1月27日,DeepSeek应用超越ChatGPT,登顶苹果美国地区应用商店免费APP下载排行榜。同时DeepSeek也成为中国区第一 。
截止北京时间2025年1月28日凌晨4点,也就是在中国农历春节除夕,据称,英伟达跌了约3000-4000多亿美元市值,等于跌掉一个英特尔加一个AMD的市值,也等于跌掉芬兰,2024年全年的GDP。到目前为止,Nvidia的市值损失了5600亿美元,是历史上损失最大的一次。