DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究者称为Underthinking。
大家都知道春节这段时间最火的莫过于deepseek,他的火热甚至超出了国内,连国外都受到热议和追捧。大家有的用来算命,有的用来聊天,也都用来预测股市等等等等。但是确实只要是你开口一问,他必定会诚心诚意的做答。只有他卡机的时候会跟你说:“服务器繁忙,请稍后再试。