国产大模型爆火,凭啥把ChatGPT“挑落马下”?家人们,最近AI圈简直炸了!在科技飞速发展的今天,人工智能领域的竞争那叫一个激烈,就像一场没有硝烟的战争。而在这场战争里,有个“黑马”横空出世,直接把行业老大哥都给比下去了,它就是咱们的国产大模型DeepSeek !
故事起因是这样的:10天前,大家都准备回家过年了,结果来自浙江的一家小公司DeepSeek火了,它发布的V3模型,震惊了美国AI圈和金融圈,还上了新闻联播,一夜之间和华为、阿里比肩齐名了,搞的扎克伯格一度呼吁美国加紧封锁中国AI技术。
1月27日,一则“DeepSeek应用超越ChatGPT,登顶苹果美国区免费App下载排行榜”的消息引爆市场,甚至被认为是大模型行业的最大“黑马”。据浙江日报“银柿财经”报道,对于下载榜排名的变化,记者分别问了问DeepSeek和ChatGPT这两名“参赛选手”的看法。
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。
西风 梦晨 发自 凹非寺量子位 | 公众号 QbitAI昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。
为了遏制中国 AI 发展,美国采取了一系列 “精确打击+全面封锁” 的手段:在芯片方面,2022 年开始,美国全面禁止英伟达和 AMD 向中国出口高端 AI 训练芯片,如 A100、H100,并在 2023 年升级禁令,连 A800、H800 这样的降级版芯片也被限制。
横空出世的DeepSeek大模型,真的爆了。昨天,DeepSeek登顶苹果中美应用商店免费App下载排行榜榜首,超越以往业界公认的老大ChatGPT,极具象征意义。一夜间,几乎所有人都开始使用它、热议它。
澎湃新闻记者 范佳来 吴遇利“DeepSeek在基座大模型上做出的突破,是天才级别的。”澎湃新闻记者 伍银芳 晁嘉笙 王煜 责任编辑:张泽红 校对:丁晓最近,国产大模型公司深度求索(DeepSeek)引发的舆论震动,让今年春节成为“最有AI味的年”。
似乎一夜之间,DeepSeek(深度求索)就“火”了。其实早些时候,这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑,近日由于其最新开源了推理模型R1正式版,不仅登顶苹果美国地区应用商店免费APP下载排行榜,在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。
DeepSeek概念5日盘中强势拉升,截至发稿,并行科技30%涨停,优刻得、安凯微、安恒信息、每日互动、拓尔思、青云科技等均涨停,万兴科技涨超15%,昆仑万维涨超10%。值得注意的是,每日互动已连续两个交易日涨停。
在 DeepSeek R1 模型发布之后,有外媒报道 Meta 的生成式 AI 部门因此陷入到恐慌之中。据传,Meta 组建了 4 个团队,试图搞清楚 DeepSeek 是如何降低训练和运行成本的,还有的团队负责研究 DeepSeek 可能使用了哪些数据来训练模型。
《科创板日报》1月27日讯(记者 黄心怡)“正如大家没法猜到,做游戏显卡的英伟达,最后会成为AI界最重要的公司。大家也没法猜到,中国AI大模型的希望,可能就在炒股的公司身上。”一名金融科技业内人士表示。今日,国内AI初创公司DeepSeek出现了短时闪崩现象。
当硅谷仍在为GPU万卡集群豪掷千亿资金时,来自杭州的一群年轻人用557.6万美元证明:AI大模型的比拼或许并不只靠规模,而是要看使用效率。只要技术实力足够强,一款上架不足半个月的App也能击败ChatGPT,在1月27日登顶苹果应用商店排行榜。