3月24日晚,DeepSeek-V3发布小版本升级,实测表现远超预期。几乎与此同时,另一款国产大模型蚂蚁百灵凭借国产芯片训练,实现同等性能突破,还将训练成本再降20%,同样引发市场关注。根据团队公布的论文显示,蚂蚁推出的百灵大模型分为两个版本——参数规模为168亿(激活参数27.
每经记者:宋欣悦 每经编辑:兰素英长久以来,英伟达凭借高性能芯片构筑起“算力霸权”,在AI模型训练领域占据主导地位。这一局面在DeepSeek问世后遭遇到不小的冲击,如今又面临着新的挑战。3月初,由蚂蚁集团首席技术官何征宇带领的Ling团队发表了一篇技术成果论文。