deep ck v3是谁研发的

资讯

刷屏的DeepSeek-V3能力到底如何？国外评测报告：超越迄今为止所有开源模型！自称ChatGPT，真相或指向“AI污染”
每经记者：郑雨航每经编辑：高涵,兰素英“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
每日经济新闻
231评论
AI界的“拼多多”，DeepSeek-V3强势来袭
12月26日，“深度求索”官方公众号宣布上线并同步开源DeepSeek-V3模型，在多领域取得显著进步，生成速度比上代提升了3倍;
全产业链研究
20评论
国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf
来源：转载机器之心报道机器之心编辑部今天，一个国产大模型火遍了世界。打开 X，满眼都是讨论 DeepSeek-V3 的推文，而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.
人工智能学家
55评论
量化巨头放大招！大模型性价比之王来了
12月26日晚，杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）宣布，全新系列模型 DeepSeek-V3 首个版本上线并同步开源，API服务已同步更新，接口配置无需改动。
21世纪经济报道
性能匹敌GPT-4o的国产模型在海外火了，训练仅花费558万美元
12月27日，海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏了，科技圈惊叹的点在于，这一模型能力对标头部模型，但训练的预算却非常低，“2048个GPU、2个月、近600万美元”，相比之下，GPT-4o等模型的训练成本约为1亿美元，至少在万个GPU量级的计算集群上训练。
第一财经
120评论

视频