据“阿里通义千问”微信公众号4月28日消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。据介绍,Qwen1.5-110B基础能力可与Meta-Llama-3-70B媲美,是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。
每经记者:赵雯琪 每经编辑:董兴生在国内外业界的共同期待中,OpenAI终于在5月14日发布了新品,对外更新GPT-4o。而国内大模型赛道的创业者们,正在迎来最接近甚至超越GPT4的时刻。5月13日,零一万物创始人兼CEO李开复发布千亿参数Yi-Large闭源模型。
新京报贝壳财经讯(记者罗亦丹)5月13日,AI公司零一万物成立一周年之际,创始人李开复携带千亿参数Yi-Large闭源模型正式亮相。一年前,李开复提出了“AI2.0”的概念,后招兵买马,宣布要做”中文ChatGPT”,零一万物应运而生。
11月27日,浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如 GPT-3 的每个参数基本上只训练了 1-2 个Token,DeepMind 的研究表明,如果把一个大模型训练充分,需要把每个参数量训练 20 个 Token。
智东西作者 | ZeR0编辑 | 漠影智东西6月16日报道,在今日举行的人工智能框架生态峰会2023上,中国科学院自动化研究所所长徐波正式发布紫东太初2.0全模态大模型。相比以前的大模型,紫东太初2.0新增了视频、传感信号、3D点云等模态,拥有了更强的认知、理解、创作能力。
去年 11 月,零一万物所发布的 Yi-34B 以开源社区「甜点级」尺寸就在 Hugging Face 榜单中,超越了 Llama2-70B、Falcon-180B 等大几倍的模型,成为当时世界范围内开源最强基础模型之一。
每经记者:杨卉 每经编辑:梁枭11月10日,在2023数字科技生态大会上,中国电信多个高管轮流上阵,接连发布了一站式智算服务平台“慧聚”、大模型星辰语义及十余个行业大模型、中国电信“天衍”量子计算云平台、5G焕新应用等多项产品、平台及技术更新。
编辑:编辑部【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。
4 月 17 日,两家大模型企业相继宣布重大更新。午间,MiniMax在其公众号宣布正式推出abab 6.5 系列模型,其中abab 6.5 包含万亿参数,支持 200k tokens的上下文长度,abab 6.5s 与 abab 6.
本报记者 王柯瑾 北京报道随着人工智能(AI)技术的飞速发展,大模型正成为全球关注的焦点,预示着未来科技的重大变革。就金融领域的应用来看,短短两年时间,从百亿级别参数到千亿级别参数,以银行为主要代表的金融机构从布局到破局,试图不断解锁AI在金融业的潜力和应用边界。