每经记者:朱成祥 每经编辑:杨夏近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。DeepSeek话题的火热,也带动其官方网页和App访问量的上升。
1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
DeepSeek因为对美股的“暴击”迅速站上市场暴风眼,这只“来自东方的神秘力量”引发海内外空前的高度关注。DeepSeek的爆火,不仅是中国AI技术的里程碑,更是全球AI行业的一次“范式革命”。这种关注是把双刃剑。
2月6日晚,深度求索(DeepSeek)发布声明称,近期有部分与DeepSeek有关的仿冒账号和不实信息对公众造成了误导和困扰,DeepSeek仅设立官方用户交流微信群,一切声称与DeepSeek官方群组有关的收费行为均系假冒。
这个春节,DeepSeek 无疑成为了科技领域最耀眼的存在。自发布以来,它迅速风靡全球,连续多日登顶苹果 App Store 和谷歌 Play Store 全球下载榜首。春节假期结束了,开工后的我迫不及待地向 DeepSeek寻求答案,如“春节吃胖了这么多,喝什么茶可以刮油?