近两天一段实车视频演示备受关注,一辆广汽智能车上的车机借助DeepSeek-R1大模型回答语音提问,预示广汽自主研发的ADiGO SENSE端云一体大模型与DeepSeek-R1大模型完成深度融合。几乎同时,工信部宣布,三家基础电信企业均全面接入DeepSeek开源大模型。
在全球AI芯片博弈升温的节点,国产大模型DeepSeek的横空出世,正在改写技术进化的底层逻辑。如今DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。如何深度理性看待AI热潮?如何评估洞察DeepSeek技术的真正潜力?
齐鲁晚报·齐鲁壹点记者 张頔在农历龙年的最后几天,横空出世的DeepSeek如飞龙在天,给了全球科技界“亿点点”震撼。DeepSeek是量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。
最近Deepseek成为了AI圈中最火爆的话题,一方面通过稀疏激活的MoE架构、MLA注意力机制优化及混合专家分配策略等创新手段,实现了高效的训练和推理能力,同时大幅降低了API调用成本,达到了行业领先水平。
仅是DeepSeek官方整理的“DeepSeek实用集成”名单,就有54款接入DeepSeek的应用,包括24个应用程序、3个AI Agent框架、1个RAG框架、1个Solana框架、3个即时通讯插件、8个浏览器插件、2个VS Code插件、3个neovim插件、2个JetBrains插件等。