自9月OpenAI发布全新AI推理大模型GPT-o1后,国内企业机构也开始了密集的更新,同步到推理模型的进程。11月25日晚,上海人工智能实验室向社会用户开放了书生·浦语大模型,并在大模型界面发布了强推理模型InternThinker。
上海世博中心人潮涌动,人们希望在7月4日~7月6日的2024世界人工智能暨人工智能全球治理高级别会议(下称WAIC)上找到关于AI未来的线索,回答大模型将沿着什么样的路径进化、当前商业落地方向是否有共识的问题。
在当日下午举行的“AI技术范式的变革:Scaling Law的尽头是什么”圆桌环节,百度集团副总裁侯震宇、中国人民大学高瓴人工智能学院教授卢志武、清智资本创始合伙人张煜、新浪微博新技术研发负责人张俊林、RWKV元始智能COO罗璇与甲子光年高级分析师王艺一起探讨了Scaling Law的发展趋势。
大模型热潮已持续近两年。当度过最初的兴奋、回归现实之时,许多从业者、开发者感到失落与迷茫,甚至对未来前景开始有所怀疑。“因为人们总是高估技术的短期价值,却低估技术的长期价值。”在9月25日举办的2024百度云智大会上,百度创始人李彦宏指出。
大模型越大越好吗?商业化落地,究竟是做B端容易还是C端?7月5日,清华大学计算机系长聘副教授,面壁智能联合创始人、首席科学家刘知远现身上海,在WAIC2024的一场分论坛作了主题分享。会后,围绕大模型领域的热点话题,南都记者对话了刘知远。 刘知远说,当前大模型技术还在快速迭代中。
5月13日,创新工场董事长兼CEO、零一万物 CEO 李开复对外发布千亿参数 Yi-Large 闭源模型,同时将此前发布的 Yi-34B、Yi-9B/6B 中小尺寸开源模型版本升级为 Yi-1.5 系列。
1月8日,北京智源人工智能研究院发布2025人工智能十大技术趋势。该预测认为,基于Scaling Law(尺度定律)推动基础模型性能提升的训练模式“性价比”持续下降,后训练与特定场景的Scaling law不断被探索。
来源:证券时报 最近,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星独角兽企图霸占全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.
本报记者 曲忠芳 北京报道2020年,OpenAI团队发表论文,正式提出了大模型开发的经验法则Scaling Law,目前它并没有统一的中文名称,大致可以理解为“规模法则”,更通俗地说是“大力出奇迹”。
5月13日,腾讯研究院发布《向AI而行,共筑新质生产力——行业大模型调研报告》(下文简称“报告”)。报告剖析了行业大模型发展、应用、实现、治理与未来发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。
“万卡集群”已成为大模型军备竞赛的最低标配,科技巨头不满足于此,纷纷开启“十万卡集群”的AI大基建步伐。9月25日的百度云智大会上,百度宣布升级作为算力基础设施的百舸AI异构计算平台。百度集团执行副总裁、百度智能云事业群总裁沈抖说,新升级的百舸4.
“Scaling Law(尺度定律)确实遇到了一些挑战,从语言能力上来看,大模型确实已经达到天花板:所有的能力已经接近人类的极限、人类专家可以评价的极限。”曾经被视为大模型“金科玉律”的Scaling Law似正逐渐放缓,影响了下一代大模型推出的节奏,这已成为AI圈内热议的话题。