来源:【爱济南新闻客户端】近日,量化巨头幻方量化的子公司深度求索(DeepSeek)发布了全新系列模型DeepSeek-V3,并同步开源。这一事件迅速引爆AI圈,DeepSeek-V3不仅霸榜开源模型,更在性能上与全球顶尖闭源模型GPT-4o和Claude-3.
2024 年 5 月 6 日,DeepSeek 发布全球最强开源 MoE 模型 DeepSeek-V2,以 236B 总参数、21B 激活,大致达到 70B - 110B Dense 的模型能力,同时消耗的显存只有同级别 Dense 模型的 1/5 - 1/100,每 token 成本大幅降低。
本报记者 吴清 北京报道近日,一家来自中国的公司Deepseek在全球AI界刷屏,其最新推出的大模型DeepSeek-V3,迅速在AI行业内引发广泛关注和热议,主要原因就是预训练成本之低,其训练同样性能的大模型成本仅是行业主流的十分之一左右。
11月20日晚间,私募巨头幻方量化宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”推理模型DeepSeek-R1-Lite预览版正式上线。据介绍,该模型目前仍处于迭代开发阶段,仅支持网页使用,暂不支持API调用。
许孝如 近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏!12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。
8月2日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。在大模型API的使用场景中,如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。
【幻方量化旗下DeepSeek发布67B大模型】财联社11月29日电,知名私募巨头幻方量化通过官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继11月初发布Coder代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。
红星资本局12月30日消息,近日,国产大模型DeepSeek在全球爆火,并带火95后AI“天才少女”罗福莉。据悉,罗福莉曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。
作 者丨孔海丽编 辑丨骆一帆DeepSeek再次爆火。近日,国内AI初创公司DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源模型不分伯仲。
据媒体报道,最近,中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。与DeepSeek一起进入大家视野的,是95后AI“天才少女”罗福莉。
幻方量化旗下大模型性能匹敌GPT-4o。最近,国产AI大模型DeepSeek-V3版本正式发布,其性能相当强悍,经初步评测,已经与GPT-4o、Claude-3.5-sonnet推理能力相当,编程能力甚至媲美最领先的3.5 Sonnet,超过GPT-4o。
大模型价格战硝烟四起,继字节跳动、阿里云、百度之后,科大讯飞、腾讯云也下场了。5月22日,科大讯飞宣布,讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API低至0.21元/万tokens。
量化巨头幻方开发的大模型来了!11月2日晚间,幻方宣布,探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”在成立半年后,发布第一代大模型——开源代码大模型DeepSeek Coder,已经开放内测,免费商用,完全开源。
2024年过去,AI又走过了狂奔的一年,大模型加速落地的热切、应用场景创新的火热和高投入、商业化缓慢带来的“下牌桌”焦虑同时处在这个行业。回过头看来,过往行业共识的一些问题在2024年中被打上了问号,例如智能算力还是否短缺、中国AI企业的“算力焦虑”是必要的吗?