每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
在国外大模型排名榜 Chatbot Arena 的基准测试里,DeepSeek-R1 的排名迅速攀升至全类别大模型第三,与 OpenAI 的 ChatGPT-4o 最新版并肩,并且在风格控制类模型分类中,和 OpenAI 的 o1 模型并列第一。其预训练费用仅 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练。
下一个改变世界的,仍是made in China大家新春快乐,在庆祝新年的同时,最火的话题,非 DeepSeek 莫属。 一边是铺天盖地的赞誉,称它为“中国 AI 之光”。图源:deepseek官网另一边,则是无休止的质疑,围绕模型来源、参数规模、实际能力等问题展开。
本报记者 郭媛丹 马 俊编者的话:中国人工智能(AI)企业DeepSeek(深度求索)推出的DeepSeek-R1和 DeepSeek-V3模型凭借在数学、代码、自然语言推理等任务上的优异性能而大受欢迎,接连在多个平台上线。
爆火海内外的DeepSeek遭到网络恶意攻击。据央视新闻报道,1月28日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击。奇安信安全专家透露,DeepSeek这次受到的网络攻击,IP地址都在美国。