基于deepseek代码复现

资讯

200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
资源消耗低，通过模型解耦与分离进一步降低算力需求，该项目支持在一张 A800 加一张 3090 完成 7B 模型的训练。根据 AutoDL 平台计费标准，一张 A800 5.98 元 / 时，一张 3090 1.32 元 / 时。
机器之心Pro
Deepseek R1 Zero成功复现全过程记录
先展示一下结果:基座模型Qwen 7B在测试集上只会基础的step by step逻辑。Demo 4， Settings: prompt mean 276 tokens， origin response mean 400 tokens。
极市平台
量化私募巨头纷纷宣布布局AI大模型，会有新的DeepSeek诞生吗？
界面新闻记者 | 龙力作为一名投资者，李萌很久之前就关注到量化私募巨头幻方量化在研究大模型，但是直到今年年初DeepSeek爆火以后，才试用到这款大模型，“原来量化私募做出来的大模型竟然这么好用”。自从DeepSeek爆火以后，不少头部量化私募表示要加码布局AI领域。
界面新闻
5评论
DeepSeek能否开启全民AI时代
经济日报近来，中国人工智能（AI）公司深度求索（DeepSeek）发布的开源大模型DeepSeek-R1火遍全球，引发业内热议：全民AI时代是否已经到来？
新重庆-重庆日报
开放合作才能照亮人工智能未来
来源：经济日报近日，深度求索（DeepSeek）公司发布的R1大模型风靡全球，是中国在人工智能（AI）大模型领域取得显著进展的一个标志性事件。DeepSeek-R1的免费和开源两大特性，与此前美国OpenAI公司的路线截然相反，照亮了人工智能的未来。
中国经济网

视频

在线举报