在国外大模型排名榜 Chatbot Arena 的基准测试里,DeepSeek-R1 的排名迅速攀升至全类别大模型第三,与 OpenAI 的 ChatGPT-4o 最新版并肩,并且在风格控制类模型分类中,和 OpenAI 的 o1 模型并列第一。其预训练费用仅 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 ,是一家专注于开发先进大语言模型和相关技术的创新型企业。它成立于 2023 年 7 月 17 日,由知名量化资管巨头幻方量化创立,自诞生起就备受业界关注。
“DeepSeek·深一度”系列③近年来,国产大模型在技术创新与市场应用上突飞猛进。就在上月底,国产人工智能大模型深度求索(DeepSeek)“小力出奇迹”,短短数日便积累超3000万用户。然而,快速发展的背后,一些隐患、漏洞也浮出水面。