AI 领域高光:于 DeepSeek 平台,他率领团队打造的 DeepSeek - V3 模型,在数学代码与中文知识问答赛道上,将行业巨头 ChatGPT - 4 甩在身后,且以 557.6 万美元的低成本训练出高性能模型;
街谈 国内外稍微对AI软件有一些了解的朋友,可能已经注意到了这几天大火的DeepSeek。DeepSeek这几日反超ChatGPT,在美区苹果应用商店免费APP下载排行第一,让许多朋友兴奋地要与收费版的ChatGPT说拜拜。
不知道美国的各个AI产品,有没有告诉技术人员,中国的AI大模型已经对美国的产品,构成了碾压态势。《中国 AI 公司几个月就弄通了 Open AI 的推理模型,美研究人员:我们很惊讶》 观察者网 2024年12月25日。
今年春节前后,中国一家成立仅仅一年半的人工智能(AI)技术公司深度求索(DeepSeek)连续冲上全球热搜榜,它给美国带来的影响已远超中国去年底发布的六代机等武器装备。美国股市上周受到DeepSeek等因素的冲击,标普500指数累计下跌1%,纳指累计下跌1.64%。
1月27日,被称为“东方神秘力量”的DeepSeek,在资本市场掀起了滔天巨浪。由于DeepSeek通过结构化稀疏注意力、混合专家系统、动态计算路由等技术,显著降低了模型训练和推理的算力消耗,由此引发了市场关于算力需求下降的担忧。