国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
撰文丨李岩近期,DeepSeek走红出圈。人民网消息显示,目前DeepSeek-R1、V3、Coder等系列模型已登陆国家超算互联网平台,用户无需下载到本地部署,即可在线完成DeepSeek系列模型的推理、部署及定制化训练与开发。
据中国基金报2月3日报道,近日,百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平台宣布上线DeepSeek大模型,用户可以在各大平台上调用DeepSeek-R1、DeepSeek-V3等模型。
每经记者:陈鹏丽 每经编辑:董兴生今年春节假期,DeepSeek无疑是最火爆的话题之一。继华为云、腾讯云、百度智能云等大平台宣布上线DeepSeek大模型后,不少上市公司也陆续透露已接入DeepSeek大模型。2月5日,多只“DeepSeek概念股”开盘涨停。
央视网消息:近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到,三家基础电信企业已经全面接入国产开源大模型DeepSeek。接入后,到底能干些什么?
凌晨3点,硅谷AI实验室突然传出惊呼——马斯克在社交平台连发3个“❗”,转发了一条来自中国的技术论文。这篇由深度求索(DeepSeek)团队发布的成果显示,其新一代大模型训练速度达到行业均值3.2倍,能耗直降40%,甚至突破冯·诺依曼架构的经典算力瓶颈。
一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
似乎一夜之间,DeepSeek(深度求索)就“火”了。其实早些时候,这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑,近日由于其最新开源了推理模型R1正式版,不仅登顶苹果美国地区应用商店免费APP下载排行榜,在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。