但VC们显然是失意的,因为包括“大模型六小龙”在内,他们支持的大模型创业项目,自始没有一个达到DeepSeek这样的全球热度,几乎与DeepSeek同时发布的,Kimi全新强化学习模型k1.5,虽然是全球继OpenAI之后首个多模态类o1模型,在诸多层面能力接近o1甚至是超越,但没有溅起多大水花,同样淹没在了DeepSeek狂热的舆论中。
文 | 李军2025年春节假期,杭州深度求索人工智能基础技术研究有限公司(以下简称DeepSeek)的热度持续攀升,也引发投资圈的关注。作为投资人,我真正关注到DeepSeek是在2024年12月末DeepSeek-V3首个版本正式上线。
以参数量高达 671b 的 DeepSeek - v3 大模型为例,仅用 2048 块 GPU 训练 2 个月,耗费 557.6 万美元,相较于 GPT - 4 等大模型,成本大幅降低,却能实现相当甚至更优的性能。
号称接入 DeepSeek 的键盘鼠标一天能卖近 100 万元,抖音平台上,该品牌鼠键 1 月 31 日销售额仅 1 万 - 2.5 万,到 2 月 6 日已飙升至 75 万 - 100 万元,涨幅近 100 倍。
中新经纬2月5日电 5日,A股DeepSeek概念股集体飙升。近日,已有包括杭钢股份、浙江东方、三六零等在内的多家上市公司公告回应相关传闻。杭钢股份:与DeepSeek系统开发、应用等核心技术无关杭钢股份5日公告称,公司主营业务为钢铁及其压延产品的生产和销售。