本报记者 吴清 北京报道近日,一家来自中国的公司Deepseek在全球AI界刷屏,其最新推出的大模型DeepSeek-V3,迅速在AI行业内引发广泛关注和热议,主要原因就是预训练成本之低,其训练同样性能的大模型成本仅是行业主流的十分之一左右。
在人工智能的竞技场上,各大巨头与新兴势力都在全力角逐,力求突破性能瓶颈。但高性能往往伴随着高昂的成本,这让许多参与者望而却步。就在这片竞争红海之中,DeepSeek 异军突起,以令人惊叹的方式实现了低成本与高性能的完美平衡,它究竟掌握了怎样的 “秘密武器”?
此外,DeepSeek 还发布了 DeepSeek Coder,专门针对编程领域优化,能够帮助开发者自动补全代码、优化算法,甚至理解复杂的代码逻辑,类似于 OpenAI 的 Codex 和 GitHub Copilot。