最近Deepseek成为了AI圈中最火爆的话题,一方面通过稀疏激活的MoE架构、MLA注意力机制优化及混合专家分配策略等创新手段,实现了高效的训练和推理能力,同时大幅降低了API调用成本,达到了行业领先水平。
大模型行业风向标快速转动有时令人猝不及防。去年C端大模型应用做得声量最大的国内厂商中,一定有豆包和Kimi。但如果最近再去看苹果中国区免费版APP排行,会发现,第一名是DeepSeek,腾讯元宝搭载DeepSeek并大方投流后,也冲到了榜单第二名。
DeepSeek带来的影响仍在继续。2月13日,腾讯AI助手“腾讯元宝”迎来重大更新,同时支持混元和DeepSeek两大模型,打开腾讯元宝并进入对话界面,即可免费使用DeepSeek-R1满血版模型。“满血版”是指完整最大型号的DeepSeekR1大模型,其参数规模高达671B。
李国杰作者李国杰肖像画。 张武昌绘受到热烈欢迎业界纷纷部署近期,中国杭州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。