deepseek模型破限

资讯

《DeepSeek速度惊呆马斯克：大模型训练效率突破物理极限》
凌晨3点，硅谷AI实验室突然传出惊呼——马斯克在社交平台连发3个“❗”，转发了一条来自中国的技术论文。这篇由深度求索（DeepSeek）团队发布的成果显示，其新一代大模型训练速度达到行业均值3.2倍，能耗直降40%，甚至突破冯·诺依曼架构的经典算力瓶颈。
实用技巧君
九成在“裸奔”！DeepSeek等模型私有化部署藏风险
2月14日，奇安信资产测绘鹰图平台监测发现，在8971个Ollama大模型服务器中，有6449个活跃服务器，其中88.9%都“裸奔”在互联网上。
京报网
48评论
DeepSeek颠覆了什么？——大模型“国产之光”破局的启示
一家人工智能初创企业浅浅扇动两下翅膀，即掀起全球科技界的一阵“海啸”。短短30天，中国初创企业深度求索（DeepSeek）先后发布两款性能比肩GPT-4o的大模型，“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
光明网
11评论
美媒惊呼：DeepSeek为何成“封杀难”的AI大模型？
最近，人工智能领域的大新闻不断，其中中国企业深度求索公司发布的大语言模型DeepSeek，成功引起全球关注，还让美媒发出“已无法被封杀”的感叹。
书海有约
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破模型推理门槛
DeepSeek-R1火遍海内外，但推理服务器频频宕机，专享版按GPU小时计费的天价成本更让中小团队望而却步。而市面上所谓“本地部署”方案，多为参数量缩水90%的蒸馏版，背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。
量子位
163评论
一夜干掉英伟达4万亿市值，DeepSeek模型崛起！美议员呼吁要制裁
一夜干掉英伟达4万亿市值，DeepSeek模型崛起!美两党议员呼吁要制裁。1月20日，DeepSeek公司推出R1推理模型，其在多领域与OpenAI o1几乎势均力敌。
黄教授
13评论
DeepSeek点燃国产大模型斗志，RAG等核心技术被重估
一边，OpenAI和Claude都破了大防，一个声讨“窃取”，一个嘲讽“落后”，两家水火不容的对手竟然以这种戏剧性的方式，鲜有地达成了一致。
量子位
1评论
清华团队突破大模型算力瓶颈：4090单卡实现DeepSeek-R1满血运行
如图所示，KTransformers 团队于 2 月 10 日成功在 24G 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版，速度提高 3~28 倍。
IT之家
353评论
DeepSeek的“蒸馏模型”超越原创？美国要对“蒸馏技术”下手
中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象，并触发了本周一美国科技股“崩盘”。1月29日，OpenAI最新称，它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型，并暗示这可能违反了OpenAI的服务条款。
第一财经
623评论
破解DeepSeek大模型，揭秘内部运行参数
研究人员通过越狱成功获取DeepSeek系统提示词，发现其还预定义了11类具体任务主题;安全内参2月8日消息，国外研究人员成功诱导DeepSeek V3，泄露了定义其运行方式的核心指令。
人工智能学家
416评论
英特尔：为DeepSeek大模型提供优化工具降低部署门槛
来源：环球网【环球网科技综合报道】近日，DeepSeek推出了一款名为Janus Pro的先进AIGC（人工智能生成内容）模型，该模型以其卓越的性能和高精度引起了行业的广泛关注。
环球网
38评论
调查新加坡，封杀Deepseek，下载最高判20年，美国输在历史太短了
中国AI大模型Deepseek在美国科技界引发的“海啸”仍在持续，此前“大地震”发生在1月27日，美国股市英伟达和一众“AI概念股”的股价大跌一万多亿美元，仅英伟达的市值就损失了五千多亿美元，美国科技股多轮暴跌，目前下跌趋势还未止住。
王新喜
1063评论
美国人下载DeepSeek，最高判20年监禁？美国下令全面封杀中国AI
【新智元导读】在美国下载DeepSeek，将判处最高20年监禁?现在，美国国会已经立法，全面禁止来自中国的先进AI模型。
新智元
187评论

加载更多

视频

加载更多