在科技飞速发展的当下,AI领域的每一次突破都能吸引全球目光。近期,一匹来自中国的黑马DeepSeek横空出世,搅乱了全球AI棋局,让整个世界都为之震撼。这一现象级的AI新秀,不仅在技术上实现了重大突破,更是在市场和国际舆论场中掀起了惊涛骇浪,背后的故事远比你想象的更加精彩。
最近,科技圈被一个名字刷屏——Deepseek,它究竟是何方神圣,能引得全球瞩目,外媒纷纷点赞?Deepseek是杭州一家成立仅一年多的公司开发的AI大模型。去年12月,面向开发者的通用大模型deepseek-3c问世,瞬间在全球AI领域激起千层浪。
这两款模型以其低廉的成本和卓越的性能,迅速在AI领域引起了轩然大波。DeepSeek-V3的预训练过程仅用了266.4万H800 GPU Hours,而Meta的Llama 3系列模型的计算预算则多达3930万H100 GPU Hours。