据“阿里通义千问”微信公众号4月28日消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。据介绍,Qwen1.5-110B基础能力可与Meta-Llama-3-70B媲美,是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。
中证网讯(记者 杨洁)在近日召开的“人工智能与数据产业发展合作论坛”上,中国电信总经理邵广禄表示,AI大模型对加速创新,提高效率有重要作用。对于AI大模型,大家逐渐形成共识,早使用,早受益。中国电信内部在网络运营、客户服务、产品应用等方面,正在积极使用大模型升级提效。
智东西作者 | ZeR0编辑 | 漠影智东西6月16日报道,在今日举行的人工智能框架生态峰会2023上,中国科学院自动化研究所所长徐波正式发布紫东太初2.0全模态大模型。相比以前的大模型,紫东太初2.0新增了视频、传感信号、3D点云等模态,拥有了更强的认知、理解、创作能力。
每经记者:赵雯琪 每经编辑:董兴生在国内外业界的共同期待中,OpenAI终于在5月14日发布了新品,对外更新GPT-4o。而国内大模型赛道的创业者们,正在迎来最接近甚至超越GPT4的时刻。5月13日,零一万物创始人兼CEO李开复发布千亿参数Yi-Large闭源模型。
但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如 GPT-3 的每个参数基本上只训练了 1-2 个Token,DeepMind 的研究表明,如果把一个大模型训练充分,需要把每个参数量训练 20 个 Token。
每经记者:杨卉 每经编辑:梁枭11月10日,在2023数字科技生态大会上,中国电信多个高管轮流上阵,接连发布了一站式智算服务平台“慧聚”、大模型星辰语义及十余个行业大模型、中国电信“天衍”量子计算云平台、5G焕新应用等多项产品、平台及技术更新。
华为常务董事、华为云CEO张平安华为大模型升级。7月6日,华为开发者大会2023(Cloud)在中国东莞举行。华为常务董事、华为云CEO张平安在会上发布盘古大模型3.0。这是一个面向行业的大模型系列,包括“5+N+X”三层架构。
百度智能云的异构计算产品经理玄凌博、资深研发工程师孙鹏、资深系统工程师武正辉,以及英伟达解决方案架构师程帅四位技术专家参与了本次线上分享会,并围绕新一代高性能AI计算集群中的技术方案和应用进行了深入剖析。
“中国创业者在移动互联网时代是最会做应用的。”文|《中国企业家》记者 赵东山编辑|李薇头图来源|受访者“国内好的大模型应用目前还是太少了,2023年大家都使劲做大模型,反倒在应用方面没有大的突破。”这是网易有道CEO周枫投身大模型一年后最大的感受。