1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
DeepSeek 遭到网络攻击的始末攻击背景DeepSeek 是一家中国 AI 独角兽公司。其 AI 应用在 2024 年底至 2025 年初迅速走红,登上苹果应用商店人工智能-免费应用榜首,表现超越了 ChatGPT。这之后, DeepSeek 成为了网络攻击的目标。
2025 年 2 月 1 日,硅基流动 x 华为云联合推出基于昇腾云的 DeepSeek R1 & V3 推理服务!这两张图片共同揭示了中国在人工智能领域加速实现技术自主化与产业升级的深层次战略布局,具体体现在以下三个方面:1、国产算力替代:突破“卡脖子”困境。
观察者网注意到,截至北京时间1月26日晚22时——仅不到半天的时间内,国产AI DeepSeek在美区苹果App Store的免费排行榜中,已一路从第六位飙升至第三位,仅次于ChatGPT及Meta公司旗下的社交媒体平台Threads,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。