界面新闻记者 | 宋佳楠2月26日,明星大模型公司DeepSeek宣布即日起在北京时间每日00:30至08:30的夜间空闲时段,大幅下调API调用价格,其中DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%,降幅最高达75%。
《科创板日报》2月12日讯(记者 张洋洋)今日,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较 MoE 架构提升2-6倍,推理成本最高可降低83%。目前,国内外大模型领域的竞争愈发激烈,已然进入白热化阶段。