1月26日—27日,短短两天内,国内AI创业公司DeepSeek(深度求索)遭遇两次短暂宕机,DeepSeek将其归因为,新模型发布后导致访问量激增。新模型指的是刚发布的推理大模型DeepSeek-R1,由此带来的访问量有多大?
DeepSeek - R1在数学、代码、自然语言推理等多项任务的性能达到OpenAI GPT - 4o模型水平,但其训练成本仅为557.6万美元,仅是OpenAI GPT - 4o不到十分之一的训练成本。
澎湃新闻记者 范佳来 吴遇利“DeepSeek在基座大模型上做出的突破,是天才级别的。”澎湃新闻记者 伍银芳 晁嘉笙 王煜 责任编辑:张泽红 校对:丁晓最近,国产大模型公司深度求索(DeepSeek)引发的舆论震动,让今年春节成为“最有AI味的年”。
1月28日凌晨,多模态大模型Janus-Pro悄然上线,这也是国内AI创业公司DeepSeek在一个月内上线的第三款大模型。受到“DeepSeek冲击”影响,英伟达股价暴跌6000亿美元,甚至殃及美股和日股市场。
DeepSeek的爆火,让一些人坐不住了,还出现了一些匪夷所思的言论。比如说,有人说DeepSeek的成功,让中国AI同行遭殃了,因为美国可能采取更加严格的措施打压中国AI领域,同行就会被DeepSeek连累。
当ChatGPT出现时,就预测过,这个新事物容易成为别人在意识形态领域进攻的工具,中国必须有。如今,中国的DeepseeK,对美国的科技造成强大冲击,美国人为何如此重视,有中国赶超速度之快的原因,也有美国想用AI技术保持世界霸权,保持世界铃响地位的意图被打破,给美国科技界带来的震撼。
横空出世的DeepSeek大模型,真的爆了。昨天,DeepSeek登顶苹果中美应用商店免费App下载排行榜榜首,超越以往业界公认的老大ChatGPT,极具象征意义。一夜间,几乎所有人都开始使用它、热议它。