来源:【四川日报-川观新闻】川观智库研究员 李媛莉当全球科技巨头围绕“千亿参数大模型”展开竞赛时,来自中国的DeepSeek(深度求索)却以“低成本、高性能、全开源”的策略,成为搅动行业格局的颠覆者。DeepSeek是什么?究竟有哪些重大影响及意义?
蛇年伊始,DeepSeek就如平地惊雷引发空前讨论,成为资本市场关注焦点,相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破,还在多个行业展现了巨大应用潜力,吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。在此背景下,南方都市报“上岗了!
DeepSeek之所以能引起这么大的轰动,主要是因为它凭借一系列的技术创新和优势,成功在众多AI模型中脱颖而出。它用较低的成本实现了接近甚至媲美一些顶级AI模型的性能,比如GPT-4o,而且它的训练成本只有同类模型的十分之一,用户使用成本也仅为OpenAI的5%。
今天咱们聊聊Deepseek,为啥国外同行们反应这么激烈?破除美国大厂技术霸权:1算力决定论的崩塌:DeepSeek用557万美元训练成本,是美国大厂chatgpt的1%左右的算力,相当于meta Llama3十分之一的训练时间,打造出比肩GPT-4的模型,直接证伪了“AI进步必须依赖天量资金与顶级芯片”的硅谷叙事。