2024 年 5 月,DeepSeek 以“价格屠夫”之姿发布 DeepSeek-V2 模型,其推理成本仅为 1 元/百万 token,相当于 GPT-4 Turbo 的七十分之一,由此直接引燃中国大模型的价格之战。
周末吹爆了!DeepSeek新模型“火“到海外,性价比继续拉满!DeepSeek是一家位于浙江杭州AI初创公司,中文名为“深度求索”,是量化巨头幻方量化的子公司,其推出的大模型DeepSeek-V3在全球AI界有广泛关注。
据外电报道,DeepSeek 首席执行官称,中国人工智能实验室 DeepSeek 可以使用数万个 NVIDIA H100 AI GPU 进行训练,可与 OpenAI 的新 o1 和 Meta 的 Llama AI 模型相媲美。
深度求索(DeepSeek)创始人梁文锋(央视《新闻联播》视频截图)在2025年1月20日举行的专家、企业家和教科文卫体等领域代表座谈会上,一位“85后”广东小伙引起众人瞩目。之后,他创立的DeepSeek的搜索量不断攀升,撼动全球AI圈。
1月28日凌晨,多模态大模型Janus-Pro悄然上线,这也是国内AI创业公司DeepSeek(深度求索)在一个月内上线的第三款大模型。DeepSeek凭借低成本、高效率,打破资源困境,重创美国科技股,被称作“DeepSeek冲击”。