DeepSeek作为国产大模型领域的破局者,凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」,在保证推理精度的同时,将训练能耗降低至同类模型的十分之一,首次验证了千亿级大模型低成本商业化的可行性。
AI新秀DeepSeek以“中国速度”席卷全网,成为现象级APP。2月8日,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。
两周之内,DeepSeek成为全球增速最快的AI应用。2月6日,昆仑芯宣布,已完成DeepSeek训练推理全版本适配,在追求低成本、高效率的基础上支持卓越性能,能够实现一键部署,为广大开发者提供更快、更强、更省的训练推理体验。
深度求索掀起惊涛骇浪作者/ IT时报记者 孙妍 郝俊慧编辑/ 钱立富“大家都过了一个DeepSeek年。”春节期间,DeepSeek(深度求索)不仅成为震惊全球AI圈的“鲶鱼”,也为国产芯片商、云厂商等国内AI生态链带来新希望。短短几天时间,DeepSeek的朋友圈持续扩容。
春节期间,你可能都被一个大模型刷屏了。2025年1月20日,中国初创企业深度求索(DeepSeek)推出开源大模型DeepSeek-R1。“极低成本对标顶尖性能”的技术突破,引得一众硅谷科技巨头连夜发声。
弘信电子集团官微2月5日消息,弘信电子战略合作伙伴燧原科技完成对DeepSeek全量模型的高效适配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.
来源:【厦门日报】美图公司展厅内展示的部分生成式AI应用。(本报记者 黄少毅 摄)国产AI大模型DeepSeek(深度求索)凭借出色的性价比,在春节期间火出圈,将中国人工智能产业推向全球科技界的聚光灯下。连日来,多家厦门科技企业接入DeepSeek,推动应用创新。
【燧原科技在多地智算中心完成DeepSeek全量推理服务部署】《科创板日报》6日讯,燧原科技今日宣布,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署,将为客户及合作伙伴提供高性能计算资源,提升模型推理效率,同时降低使用门槛,大幅节省硬件成本。
最近有好多粉丝都问我,DeepSeek这个题材到底能火多久呢?会不会没几天就凉了,就像1月的小红书那样?这也是我一直在跟踪、研究和思考的问题。不过经过下面的分析,你就会明白,它的影响力可能比我们想象的要大得多,现在或许仅仅是个开头,就如同蝴蝶扇动翅膀引发龙卷风的起始点一样。
西北角·中国甘肃网记者 程健 通讯员 田永斌 吴万宝近期,国产大模型DeepSeek凭借其技术创新与高效部署能力,成为行业焦点。作为国产AI领域的“国家队”“排头兵”“主力军”,中国移动与DeepSeek强强联合,在技术研发、算力部署、场景应用等方面全方位展开深度合作。