11月29日晚,知名私募巨头幻方量化通过官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继11月初发布Coder代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。模型已完全开源,同时服务已经全面开放内测。
11月20日晚间,私募巨头幻方量化宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”推理模型DeepSeek-R1-Lite预览版正式上线。据介绍,该模型目前仍处于迭代开发阶段,仅支持网页使用,暂不支持API调用。
8月2日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。在大模型API的使用场景中,如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。
12月26日,幻方量化旗下探索AGI(通用人工智能)的组织“深度求索(DeepSeek)”宣布,模型DeepSeek-V3首个版本上线并同步开源。当前版本的DeepSeek-V3暂不支持多模态输入输出。此外,模型API服务定价将调整为每百万输入tokens 0.
21世纪经济报道记者李域 深圳报道量化私募巨头幻方成为了AI大模型市场中的“鲶鱼”。7月4日,AI公司深度求索(DeepSeek)发文称,DeepSeek API已经上线128K上下文长度,价格保持不变,还在大家熟悉的,即“每百万tokens输入1元、输出2元”。
在全球生成式人工智能浪潮带动下,国产大模型也不断取得技术进展,部分企业在能力上已经可以与海外主流模型实现对标。分析员 臧若晨 SAC 执证编号:S0080522070018 SFC CE Ref:BTM305。