豆包组织架构

资讯

豆包提出全新稀疏架构降低推理成本
新京报贝壳财经讯 2月12日，据“豆包大模型团队”微信公众号，近期，字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem，该架构有效解决了 MoE 推理时高额的访存问题，推理速度较 MoE 架构提升 2-6 倍，推理成本最高可降低 83%。
新京报
2评论
豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%
每经北京2月11日电（记者杨昕怡）豆包大模型团队今日宣布，团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家模型）推理时高额的访存问题，推理速度较MoE架构提升2~6倍，推理成本最高可降低83%。
每日经济新闻
字节豆包大模型团队提出稀疏模型架构UltraMem
2月12日，据豆包大模型团队消息，字节跳动豆包大模型Foundation团队近期提出UltraMem，一种同样将计算和参数解耦的稀疏模型架构，在保证模型效果的前提下解决了推理的访存问题。
界面快讯
字节豆包大模型团队推出稀疏模型架构UltraMem
来源：环球网【环球网科技综合报道】2月13日消息，字节跳动豆包大模型Foundation团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。这一架构通过将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。
环球网
1评论
盘前必读丨特朗普呼吁降息；豆包提出全新稀疏架构
【财经日历】美国1月PPI年率；IEA公布月度原油市场报告。美股周三涨跌互现，高于预期的通胀数据加剧了美联储短期内不会降息的担忧，而CVS 健康等一些乐观的财报则提振了市场信心，中概股表现不俗。截至收盘，道指跌225.09点，跌幅0.50%，报44368.56点，纳指涨0.
第一财经
豆包大模型新架构推理成本较 MoE 最高可降 83%
北京商报讯（记者魏蔚）2月12日，字节跳动豆包大模型团队宣布，已提出全新的稀疏模型架构 UltraMem，该架构有效解决了 MoE 推理时高额的访存问题，推理速度较 MoE 架构提升 2-6 倍，推理成本最高可降低 83%。
北京商报
字节跳动豆包大模型团队开源一项MoE架构优化技术
字节跳动豆包大模型团队近日开源一项名为COMET的MoE架构优化技术，可将大模型训练效率提升1.7倍。论文显示，该技术已实际应用于字节的万卡集群训练，实现数百万GPU小时训练算力的节省。
界面快讯
知情人士回应字节跳动大模型团队架构调整
潮新闻客户端记者楼纯近日，有传闻称前谷歌AI专家吴永辉加入字节跳动，并担任大模型团队Seed基础研究负责人后，字节跳动对大模型团队进行了架构调整。多名原本向朱文佳汇报的算法和技术负责人开始转向吴永辉汇报。
钱江晚报
豆包拿不出干粮
在接入DeepSeek十天后，从2月22日开始，腾讯旗下的AI应用“腾讯元宝”，就超越字节旗下AI应用豆包，跃居中国区苹果应用商店免费APP下载排行榜第二位，并一直维持至今。
虎嗅APP
79评论
抖音接入豆包算不算“反击”
“相关能力测试中，主要是希望为用户提供更丰富的AI服务”，3月5日，针对抖音测试接入豆包一事，抖音相关负责人回应。根据网络截图，抖音App为豆包开放了两个超级入口，一个位于短视频界面，与点赞、评论、转发等功能处于同一竖列；另一个位于抖音App的消息列表内。
北京商报
1评论

视频

在线举报