deepseek-R1被复现

资讯

Deepseek R1 Zero成功复现全过程记录
先展示一下结果:基座模型Qwen 7B在测试集上只会基础的step by step逻辑。Demo 4， Settings: prompt mean 276 tokens， origin response mean 400 tokens。
极市平台
200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
资源消耗低，通过模型解耦与分离进一步降低算力需求，该项目支持在一张 A800 加一张 3090 完成 7B 模型的训练。根据 AutoDL 平台计费标准，一张 A800 5.98 元 / 时，一张 3090 1.32 元 / 时。
机器之心Pro
量化机构九坤投资和微软成功复现DeepSeek-R1
【量化机构九坤投资和微软成功复现DeepSeek-R1】财联社记者获悉，九坤投资与微软亚洲研究院近日刊文称，首次成功复现了DeepSeek-R1，特别是其在强化学习领域的成果，同时在技术层面提出了创新性的见解。
财联社
36评论
DeepSeek有望激发新一波人工智能创新浪潮
来源：经济参考报中国人工智能（AI）企业深度求索（DeepSeek）日前发布其最新开源模型DeepSeek-R1，用较低的成本达到了接近于美国开放人工智能研究中心（OpenAI）开发的GPT-o1的性能。
台海网
DeepSeek能否开启全民AI时代
经济日报近来，中国人工智能（AI）公司深度求索（DeepSeek）发布的开源大模型DeepSeek-R1火遍全球，引发业内热议：全民AI时代是否已经到来？
新重庆-重庆日报
DeepSeek突发！本周启动！
万众瞩目的DeepSeek“开源周”，第一弹来了。2月24日，DeepSeek开源了首个代码库FlashMLA。
潇湘晨报
3评论
多家百亿量化机构加入AI战局
证券时报记者许孝如随着DeepSeek的火爆，多家百亿量化私募也加入AI（人工智能）战局。近日，量化巨头九坤携手微软团队成功复现DeepSeek-R1，还首次发现了语言混合（例如中英文夹杂）会显著降低推理能力等问题，引发市场关注。
证券时报
多家百亿量化机构加入AI战局
随着DeepSeek的火爆，多家百亿量化私募也加入AI（人工智能）战局。近日，量化巨头九坤携手微软团队成功复现DeepSeek-R1，还首次发现了语言混合（例如中英文夹杂）会显著降低推理能力等问题，引发市场关注。
证券时报
中国电信创新点亮AI潮　勇攀大模型时代 “智” 高点
来源：【通信信息报社】（记者林婉玲）在当今数字化时代，AI无疑是最为耀眼的技术力量，被誉为 “新基建之智”。而大模型作为从“+AI”向“AI+”转变的能力内核，正以颠覆性的力量重塑着各个行业的业务模式，催生全新的业务形态。
全国党媒信息公共平台

视频