豆包提出新的稀疏模型

资讯

豆包大模型提出稀疏模型架构，推理成本较MoE最高可降83%
每经北京2月11日电（记者杨昕怡）豆包大模型团队今日宣布，团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家模型）推理时高额的访存问题，推理速度较MoE架构提升2~6倍，推理成本最高可降低83%。
每日经济新闻
字节豆包大模型团队推出稀疏模型架构UltraMem
来源：环球网【环球网科技综合报道】2月13日消息，字节跳动豆包大模型Foundation团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。这一架构通过将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。
环球网
1评论
字节豆包大模型团队提出稀疏模型架构UltraMem
2月12日，据豆包大模型团队消息，字节跳动豆包大模型Foundation团队近期提出UltraMem，一种同样将计算和参数解耦的稀疏模型架构，在保证模型效果的前提下解决了推理的访存问题。
界面快讯
1评论
盘前必读丨特朗普呼吁降息；豆包提出全新稀疏架构
【财经日历】美国1月PPI年率；IEA公布月度原油市场报告。美股周三涨跌互现，高于预期的通胀数据加剧了美联储短期内不会降息的担忧，而CVS 健康等一些乐观的财报则提振了市场信心，中概股表现不俗。截至收盘，道指跌225.09点，跌幅0.50%，报44368.56点，纳指涨0.
第一财经
云计算沪港深ETF（517390）收涨3.68%，汉得信息涨停，豆包提出全新稀疏架构
2月12日，A股三大指数午后拉升，截至收盘，上证指数涨0.85%，深证成指涨1.43%，创业板指涨1.81%。全天两市成交额16772亿元，较上一交易日放量413亿元。全市场市场股票呈现涨多跌少的态势，3560只股票上涨，1568只股票下跌。
21世纪经济报道
紧追DeepSeek！豆包提出Ultramam新模型！行业受益公司名单出炉…
2月12日，据财联社报道，字节跳动豆包大模型团队，近期发现一种新的稀疏大模型架，实验证明该模型架构可以保证效果的同时，降低推理成本最高达83%。
御今说
43评论
豆包概念股午后拉升移远通信涨逾4%
每经AI快讯，2月12日，豆包概念股午后拉升，移远通信涨逾4%，乐鑫科技涨逾3%。消息面上，近期，字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2—6倍，推理成本最高可降低83%。
每日经济新闻
豆包又把算力成本“打了下来” 但压力才刚刚开始
《科创板日报》2月12日讯（记者张洋洋）今日，字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem，该架构有效解决了MoE推理时高额的访存问题，推理速度较 MoE 架构提升2-6倍，推理成本最高可降低83%。目前，国内外大模型领域的竞争愈发激烈，已然进入白热化阶段。
财联社
4评论
重大突破！中国科研团队人工合成出超级钻石；传深圳住房公积金新政即将落地；宇树人形机器人售价曝光；鸿蒙智行官宣：3年0息
国家统计局公布了31省份2025年1月居民消费价格指数。其中27省份同比上涨，4省份同比下降，上月“涨平跌”省份分别为13个、8个和10个。
金融界
宇树科技在京开启招聘；中国体彩：再强大的AI也无法预测中奖号码｜数智早参
每经记者：李少婷每经编辑：杨夏丨 2025年2月13日星期四丨NO.1 消息称苹果与阿里巴巴合作开发AI功能2月11日深夜，消息称，苹果最近开始与阿里巴巴集团合作，在中国推出人工智能功能。
每日经济新闻
企业新动作频频加速竞跑AI大模型赛道
来源：经济参考报连日来，随着深度求索公司（DeepSeek）发布其最新开源模型DeepSeek-R1在国内外引发热烈关注，百度、腾讯、阿里巴巴、字节跳动等企业纷纷宣布旗下AI大模型、AI应用新动作，包括全面免费使用、接入DeepSeek模型以及拓展国际合作等，进一步竞速AI大模型
台海网
美团近期将公布“取消骑手超时扣款”具体方案；SHEIN启动2025“爆单计划”｜未来商业早参
每经记者：王郁彪每经编辑：魏官红｜ 2025年2月13日星期四｜NO.
每日经济新闻

加载更多

视频