每经记者:朱成祥 每经编辑:杨夏近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。DeepSeek话题的火热,也带动其官方网页和App访问量的上升。
1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
deepseek大火,春节闲来无事,本地部署deepseek r1 7B,迷你主机7840加核显,跑起来也不觉得卡顿,只是同一个问题本地部署回答的跟官网完全体差了十万八千里,问题是让deepseek 模仿滕王阁序,用骈文写一篇介绍宝丰县的文章。
21世纪经济报道记者 赵云帆 报道春节期间火遍全网的 DeepSeek,大有越烧越旺的趋势,飓风般席卷激荡着全球资本市场。Wind数据显示,继春节前一个交易日上涨10.9%后,万得 DeepSeek 指数节后两个交易日分别上涨13.09%和6.09%。