北京日报客户端 | 记者 袁璐国产大模型进入长跑期后,正从参数至上转向实用优先。9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并通过腾讯云对外全面开放。据悉,该大模型是其自研的通用大语言模型,拥有超千亿参数规模。
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大语言模型正式亮相,并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。此前的大半年,国内云厂商跟随ChatGPT,掀起“百模大战”。
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云向外开放。据了解,混元大模型将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。
界面新闻记者 | 崔鹏界面新闻编辑 | 文姝琪5月30日,腾讯推出基于混元大模型的App“腾讯元宝”,主要面向工作场景,提供AI搜索、AI总结和AI写作等核心能力,同时面向日常生活场景新增创建个人智能体的能力。
界面新闻记者 崔鹏9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式对外亮相,同时宣布通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens。
界面新闻记者 | 崔鹏界面新闻编辑 | 宋佳楠11月5日,腾讯混元宣布开源两款最新的大模型产品,分别是MoE架构的大语言模型“Hunyuan-Large(混元Large)”,以及3D生成大模型“Hunyuan3D-1.
21世纪经济报道记者白杨 北京报道随着大模型时代到来,模型参数呈指数级增长,已达到万亿级别。与此同时,大模型也逐渐从支持单一模态、单一任务发展为支持多种模态下的多种任务。在这种趋势下,大模型训练所需算力巨大,远超单个芯片的处理速度,而多卡分布式训练通信损耗巨大。
在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。11月23日,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架的2.6倍,千亿级大模型训练可节省50%算力成本。
e公司讯,在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本?11月23日,腾讯披露,混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架的2.6倍,千亿级大模型训练可节省50%算力成本。
在百度发布“文心一言”、阿里发布“通义千问”大模型后,腾讯什么时候发布通用型大模型?”成为业界关心的话题。对于这些问题,腾讯2023年股东大会上,腾讯董事会主席马化腾回应称“腾讯正在专注于研发工作,并不急于展示尚未成熟的产品。
11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。据了解,腾讯混元大模型是腾讯自研的一款实用级通用大模型,目前已经接入腾讯50多个业务测试并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。
新京报贝壳财经讯(记者 白金蕾)4月14日,腾讯云正式发布新一代高性能计算集群。该集群采用腾讯自研的星星海服务器,服务器之间采用业界最高的3.2T(太字节,Terabyte)超高互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。
9月5日~6日,腾讯生态大会宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。