腾讯大模型底层框架是自研的吗

资讯

腾讯大模型终于来了
BAT三巨头中，腾讯无疑是对大模型最谨慎的一家，百度推出文心一言时，腾讯按兵不动，阿里推出通义千问时，腾讯静悄悄，今日之前最高调的一次，当属面向B端发布了行业大模型。
北京商报
腾讯自研混元大模型亮相
北京日报客户端 | 记者袁璐国产大模型进入长跑期后，正从参数至上转向实用优先。9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，并通过腾讯云对外全面开放。据悉，该大模型是其自研的通用大语言模型，拥有超千亿参数规模。
北京日报
腾讯混元大模型亮相：全链路自研，聚焦应用死磕“幻觉”
9月7日，在2023腾讯全球数字生态大会上，腾讯混元大语言模型正式亮相，并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。此前的大半年，国内云厂商跟随ChatGPT，掀起“百模大战”。
每日经济新闻
1评论
腾讯发布混元大模型：全链路自研，旨在解决产业痛点
9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，并宣布通过腾讯云向外开放。据了解，混元大模型将作为腾讯云MaaS服务的底座，客户不仅可以直接通过API调用混元，也可以将混元作为基底模型，为不同产业场景构建专属应用。
南方都市报
腾讯混元大模型负责人刘煜宏：腾讯做大模型不争一时之先
界面新闻记者 | 崔鹏界面新闻编辑 | 文姝琪5月30日，腾讯推出基于混元大模型的App“腾讯元宝”，主要面向工作场景，提供AI搜索、AI总结和AI写作等核心能力，同时面向日常生活场景新增创建个人智能体的能力。
界面新闻
腾讯自研混元大模型正式亮相：从零开始训练，全面拥抱大模型
据界面新闻，9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式对外亮相，同时宣布通过腾讯云对外开放。
界面新闻
1评论
腾讯自研混元大模型正式亮相：从零开始训练，重点解决“胡言乱语”问题
界面新闻记者崔鹏9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式对外亮相，同时宣布通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示，混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens。
界面新闻
2评论
腾讯自研大模型助力长三角打造世界级产业集群
现场，腾讯集团副总裁、政企业务总裁李强表示，腾讯不仅通过自研大模型服务千行百业，也拥有坚实的AI基础设施服务，为中国大模型产业繁荣发展提供技术支撑。
纵相新闻
腾讯再开源两款最新大模型，开闭源之争又起波澜
界面新闻记者 | 崔鹏界面新闻编辑 | 宋佳楠11月5日，腾讯混元宣布开源两款最新的大模型产品，分别是MoE架构的大语言模型“Hunyuan-Large（混元Large）”，以及3D生成大模型“Hunyuan3D-1.
界面新闻
4评论
腾讯汤道生：腾讯通用大模型不存在“追赶”说法，行业仍处于早期
“（腾讯云）70%的资源投入在即时收入和利润上， 20%投入在中期技术，可能再过两年就会产生商业变现；最后10%投入在非常早期的前沿技术，提前对未来布局，可能要三至五年或者更久，才能带来商业回报。
澎湃新闻
腾讯披露最新大模型训练方法，可节省50%算力成本
21世纪经济报道记者白杨北京报道随着大模型时代到来，模型参数呈指数级增长，已达到万亿级别。与此同时，大模型也逐渐从支持单一模态、单一任务发展为支持多种模态下的多种任务。在这种趋势下，大模型训练所需算力巨大，远超单个芯片的处理速度，而多卡分布式训练通信损耗巨大。
21世纪经济报道
腾讯大模型开源的“冷思考”
本报记者李静北京报道继腾讯混元文生图模型开源之后，近日，腾讯混元最新的MoE模型“混元Large”以及混元3D生成大模型“Hunyuan3D-1.
中国经营报
4评论
大模型训练效率提升至2.6倍，腾讯Angel机器学习框架升级
在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本，成为业界关注的焦点。11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。
扬子晚报
大模型训练效率提升，腾讯Angel机器学习框架升级
e公司讯，在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本？11月23日，腾讯披露，混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。
证券时报e公司
腾讯喊你“向云端”，成为“青云”之子，AI 大模型扩招 50%
ChatGPT的大火，让人工智能走进了大众的视野。而围绕大语言的研究也是层出不穷，国内外大厂更是紧跟其上，打造出了一个又一个开源或者闭源可商用的大语言模型。
人工智能研究所
5评论
腾讯大模型三条腿走路：通用型、产业型、投资型
在百度发布“文心一言”、阿里发布“通义千问”大模型后，腾讯什么时候发布通用型大模型？”成为业界关心的话题。对于这些问题，腾讯2023年股东大会上，腾讯董事会主席马化腾回应称“腾讯正在专注于研发工作，并不急于展示尚未成熟的产品。
第一财经
腾讯开源3D生成大模型，同时支持文、图生成
11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求，可在HuggingFace、Github等技术社区直接下载，免费可商用。
北青热点
腾讯混元大模型正式亮相，2023腾讯全球数字生态大会召开
9月7日，在2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，并宣布通过腾讯云对外开放。据了解，腾讯混元大模型是腾讯自研的一款实用级通用大模型，目前已经接入腾讯50多个业务测试并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。
读创网
面向大模型训练，腾讯云发布算力提升三倍的大模型计算集群
新京报贝壳财经讯（记者白金蕾）4月14日，腾讯云正式发布新一代高性能计算集群。该集群采用腾讯自研的星星海服务器，服务器之间采用业界最高的3.2T（太字节，Terabyte）超高互联带宽，为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。
新京报
对标GPT-4o，腾讯云助客户5分钟开发一款大模型
9月5日~6日，腾讯生态大会宣布推出新一代大模型“混元Turbo”，相比前代模型，腾讯混元Turbo性能显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，效果在多个基准测试上对标GPT-4o，且第三方测评居国内第一。
南方+客户端

加载更多

视频

在线举报