每经记者:岳楚鹏 每经编辑:兰素英|2025年2月7日星期五|NO.1 亚马逊被曝准备发布新一代AI助手Alexa近日,据外媒报道,亚马逊正准备推出新一代AI助手Alexa。据报道,亚马逊计划在2 月26 日的活动中公布预览升级版的 Alexa。
每经记者:宋欣悦 每经编辑:陈柯名,高涵①【三大期指齐涨】截至发稿,道指期货涨0.19%、标普500指数期货涨0.24%、纳指期货涨0.07%。 ②【热门中概股盘前普涨】热门中概股盘前普涨,阿里巴巴涨1.87%,拼多多涨2.07%,京东涨1.38%,理想汽车涨4.
最近,AI 圈彻底被一则重磅消息 “炸” 翻了天!斯坦福大学李飞飞团队,凭借着仅 50 美元的云计算费用,成功训练出了堪称惊艳的 s1 推理模型。令人难以置信的是,这款模型的性能竟然与 OpenAI、DeepSeek 等行业巨头的顶尖模型不相上下。
【独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成】《科创板日报》6日讯,今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。
1月27日,国产的DeepSeek应用成功登顶美国地区的手机应用商店上,而该软件更是位居榜首,下载量直接超过了美国的ai软件ChatGPT。随着DeepSeek的爆火,创始人梁文锋的身价也是水涨船高,直接在美国引起不小的轰动,足以震惊全球,更是被海外称为“来自东方的神秘力量”。
最近,AI 领域投下了一颗重磅炸弹:李飞飞团队竟然号称仅用 50 美元就复刻出了 DeepSeek R1 模型!这消息一传出,整个行业都震惊了,50 美元就能做到别人花费数百万美元才能完成的壮举?今天,就让我们深入探究其中的奥秘。
每经记者:宋欣悦 每经编辑:兰素英2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 GPU,耗时26分钟就完成了训练,成功“打造”出了一个名为s1-32B的人工智能推理模型。
第一个叫板DeepSeek的是华裔李飞飞,据透露,她仅用50美元,短时间就蒸馏出类似DeepSeek-R1的推理模型S1,该模型在数学及编码能力方面,与OpenAI O1和DeepSeek R1几乎处于同一水平。
阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。文|小说故事汇编辑|小说故事汇最近AI圈儿可炸锅了!国产DeepSeek火遍海外,下载量直接爆表,结果呢?
“DeepSeek冲击”余威仍在,近日,“AI教母”李飞飞团队推出的AI推理模型s1,在数学和编程测试中,与OpenAI o1和DeepSeek R1不分伯仲,更关键是训练成本仅50美元。如此低成本的推理模型,再度引发了业内讨论。
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
近日,有消息称,华裔科学家、“AI教母”李飞飞的团队研究人员以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型。记者从相关人士处了解到,这个s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。