撰文:王杰夫、梁夏琦、吴一凡、王艺澄编辑:吴洋洋Key PointsApp上线第17天,DeepSeek 日活用户超过豆包,如今已超过ChatGPT的一半;OpenAI首度公开了模型推理时的思维过程(CoT),虽然经过了二次处理;DeepSeek如何扩容?
DeepSeek和豆包,谁才是AI界的“扛把子”?实测结果让人意外!最近,AI圈可是热闹非凡,两大神器DeepSeek和豆包让人眼前一亮,本来觉得豆包已经很厉害了,但DeepSeek横空出世,和豆包一样号称能写文案、做设计、甚至陪你聊天解闷儿!但问题是,这俩到底谁更胜一筹?
《科创板日报》2月12日讯(记者 张洋洋)今日,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较 MoE 架构提升2-6倍,推理成本最高可降低83%。目前,国内外大模型领域的竞争愈发激烈,已然进入白热化阶段。
上周五,本报发文提出问题,《DeepSeek一骑绝尘,“豆包们”怎么办?》,字节豆包的回应来了。字节跳动在近日召开的2025年全员会上对大模型业务进行了深度反思。字节跳动CEO梁汝波坦言,公司在大模型新机遇前迟钝,2025年要追求智能上限。