moe混合专家模型

资讯

专家混合模型（MOE）推理优化技术全景：从模型到硬件的深度解析
近日由来自来自香港中文大学和上海交通大学的研发团队，发表了《A Survey on Inference Optimization Techniques for Mixture of Experts Models》对MoE模型的推理优化技术进行全面梳理，从模型级、系统级到硬件级，深入探讨各种优化策略及其应用。
北方的郎
1评论
最全解读MoE混合专家模型：揭秘关键技术与挑战
近期，法国AI公司Mistral-AI再次成为业界焦点，他们开源了一款专家模型。本文将从三个方面解读MoE混合专家模型，一起来看看吧。
人人都是产品经理
3评论
10秒即可生成高质量3D资产，腾讯混元大语言模型和3D模型开源
11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求，可在HuggingFace、Github等技术社区直接下载，免费可商用。
南方+客户端
详解DeepSeek-V3：大模型训练加速神器，MoE焕发新生丨智源深度
我国科技企业在过去的几年里，始终坚持着开发出能够解决更为复杂问题并处理更大数据量的模型的目标，而这一切并不需要依赖过多的计算能力。
人工智能学家
2评论
再开源两款大模型，腾讯慢慢来
同行几乎每月都在发布大模型开源消息，腾讯的类似新闻发生在6个月前。11月5日，腾讯将MoE模型“混元Large”以及混元3D生成大模型“Hunyuan3D-1.0”正式开源，这两个模型已在腾讯业务场景落地，支持企业及开发者精调、部署等不同场景的使用需求。
北京商报
1评论
腾讯再开源两款最新大模型，开闭源之争又起波澜
界面新闻记者 | 崔鹏界面新闻编辑 | 宋佳楠11月5日，腾讯混元宣布开源两款最新的大模型产品，分别是MoE架构的大语言模型“Hunyuan-Large（混元Large）”，以及3D生成大模型“Hunyuan3D-1.
界面新闻
4评论
对标马斯克和奥特曼，上海大模型、人形机器人、脑机接口成果频现
近日，上海人工智能实验室发布了推理大模型InternThinker（书生思想者）。公众在电脑上登录“书生·浦语”大语言模型后，点击界面左侧的InternThinker链接，就能体验这个对标OpenAI o1的沪研推理模型的实力。
上观新闻
73评论
傅盛：数据才是大模型行业的竞争壁垒
2024年，全球MoE（混合专家）大模型数量呈爆发增长态势，已成为大模型领域的主流架构之一。“大模型行业竞争，真正的竞争壁垒在于数据。
京报网
浪潮信息发布“源2.0-M32”开源大模型
5月28日，浪潮信息发布“源2.0-M32”开源大模型。“源2.0-M32”在基于“源2.
光明网
“技术水平无法支撑价格战创业公司难卷赢大厂”
“降价97%！”“免费！”过去一周多内，价格战在大模型厂商之间延烧。回溯来看，这场价格战肇始于一家名叫深度求索的大模型创业公司。后来“战火”越烧越猛，归因于云计算厂商纷纷入局。
南方都市报

视频