1月28日凌晨,多模态大模型Janus-Pro悄然上线,这也是国内AI创业公司DeepSeek在一个月内上线的第三款大模型。受到“DeepSeek冲击”影响,英伟达股价暴跌6000亿美元,甚至殃及美股和日股市场。
1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
当地时间1月27日,美国三大股指开盘即暴跌,英伟达、微软、谷歌母公司Alphabet、Meta等美国主要科技股均遭遇股市地震。其中英伟达跌近17%,单日市值蒸发约6000亿美元,创美股最高纪录。这一切,要从成立了仅一年多的中国人工智能初创公司深度求索(DeepSeek)说起。
现在,我看在西方媒体的中文页面上,在介绍DeepSeek时,都会说它是中国的深度探索公司,然后再加个——这就深刻表现了美国人对中国文化全球化方面的进步根本不了解,其实在中国,根本没有人称DeepSeek为深度探索,而是直接称为DeepSeek,这几个英文在中国人人听得懂,记得住。
来源:国际在线DeepSeek的爆火,让一些人坐不住了,还出现了一些匪夷所思的言论。比如说,有人说DeepSeek的成功,让中国AI同行遭殃了,因为美国可能采取更加严格的措施打压中国AI领域,同行就会被DeepSeek连累。
2025年1月20日,中国初创企业深度求索(DeepSeek)推出开源大模型DeepSeek-R1。“极低成本对标顶尖性能”的技术突破,引得一众硅谷科技巨头连夜发声。短短一周内,DeepSeek登顶全球140个市场的应用商店下载榜,甚至因访问量过载一度“崩服”。