1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
deepseek遭到网络恶意攻击,我从它那里搜到这样的评论:《当硅谷牛仔邂逅东方熊猫:一场数字时代的黑色幽默剧》 近期,美国针对中国科技公司 DeepSeep 所实施的网络攻击事件,恰似现实版《谍中谍》与《黑客帝国》的交融。
美西方眼看着没法阻止deepseek前进的步伐,就在咱们欢度春节之际,一场没有硝烟的战争不期而至,惯用的伎俩登场。红客联盟表示,大量的美国IP对deepseek发起超大规模的网络攻击,攻击如同暴雨倾盆。
deepseek在1月20号推出AI模型R1,此模型可与OpenAI的ChatGPT媲美,开发成本远低于竞争产品,冲击了美国各大科技巨头以及科技股市,导致相关产业股票暴跌,英伟达股价暴跌约17%,博通公司股价下跌17%,超威半导体公司股价下跌6%,微软股价下跌2%。