其核心产品DeepSeek-Coder-33B模型在HumanEval测试中92.6%的惊人准确率,不仅碾压了硅谷明星公司Anthropic的对应产品,更让GitHub Copilot在中国开发者群体中的市场份额三个月内缩水27%。
这家杭州企业仅用558万美元就训练出超越GPT-4的MoE架构大模型,成本仅为OpenAI的5%,直接引爆全球AI界。而江苏省委机关报《新华日报》的追问更是火上浇油:“为什么这些科技新贵都诞生在杭州?”
2024 年 5 月,DeepSeek 发布混合专家语言模型 DeepSeek-V2,因其创新的模型架构和超低的推理成本引发热议,推理成本仅为 GPT-4 Turbo 的七十分之一,被称为 “AI 界的拼多多” 。
当下,人工智能已如旋风般席卷生活各处。从手机语音助手到购物网站精准推荐,AI 不再神秘,而是融入日常。一款名为 Deepseek 的人工智能工具近期在科技圈引发关注,大家好奇:普通老百姓能否使用?又该如何使用?今天就来深入探讨,揭开 Deepseek 的神秘面纱。
开年来DeepSeek概念板块爆火,京东云、华为云、腾讯云、阿里云、百度智能云等主流云平台相继宣布接入DeepSeek系列模型,中国移动的移动云也宣布全面上线DeepSeek。DeepSeek背后的杭州企业深度求索也受到了广泛关注。同时,另一家杭州企业宇树科技持续爆火出圈。
搞好营商环境,是发展一地经济的根本所在。2023年11月28日拍摄的杭州城西科创大走廊(无人机照片)。图/新华社文 | 刘远举为什么这些“科技新贵”都诞生在杭州?这是江苏媒体近期对DeepSeek及“杭州六小龙”的最新一轮探讨。