每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
末段化用武侯名言,彰显中国AI人“鞠躬尽瘁”之志。DeepSeek近期推出高性能开源模型DeepSeek-V3和DeepSeek-R1,在数学、代码生成等任务上媲美GPT-4o等顶级闭源模型,并以557.6万美元的低成本实现高效训练,突破美国芯片封锁。
节前最后一天,算力板块居然出现了崩盘,而且崩盘的理由颇为奇葩。据说,国内有一家名为deep sick的公司推出了一款名为V3的大模型,其性能据称比OpenAI同类大模型还要优越。这一消息本身已经足够令人震惊,但更让人震惊的是,这款大模型对算力的需求竟然只有同类大模型的十分之一。
蛇年春节,Deep Seek搞了一场科技界的春节联欢晚会,震碎整个AI研发界的三观。这个中国土生土长的初创公司,成立仅仅一年多时间,花费仅560万美元的训练成本,做出的生成式人工智能方面的性能,可对标OpenAI的顶尖模型O1。