DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究者称为Underthinking。
2025年1月20日,中国初创企业深度求索(DeepSeek)推出开源大模型DeepSeek-R1。“极低成本对标顶尖性能”的技术突破,引得一众硅谷科技巨头连夜发声。短短一周内,DeepSeek登顶全球140个市场的应用商店下载榜,甚至因访问量过载一度“崩服”。
横空出世的DeepSeek大模型,真的爆了。昨天,DeepSeek登顶苹果中美应用商店免费App下载排行榜榜首,超越以往业界公认的老大ChatGPT,极具象征意义。一夜间,几乎所有人都开始使用它、热议它。
在日前举行的广东省高质量发展大会上,DeepSeek作为人工智能领域的代表,被点名表扬其“以不怕虎的勇气锐气撼动美国人工智能巨头、产生连锁效应”,可见DeepSeek如今的火爆程度和被寄予的厚望,而前一个在全球拥有如此大影响力的中国互联网产品,就要数《黑神话:悟空》了。