1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
据传,自deepseek在国外大火之后,美国已经开始进行了反制措施,前后派了不少黑客高手来黑deepseek的系统,甚至还以威胁国家安全的风险将其上会研究,要是没有国家出手援助,等待deepseek的结果肯定好不。
周一晚间,美股开盘暴跌。有投资者预测,全市场一天内将蒸发超一万亿美元!截至发稿,纳指跌超3%,道指跌0.42%,标普500指数跌1.80%。美股科技股全线崩跌,费城半导体指数跌超6%。芯片股跌幅居前,博通跌超12%,英伟达跌超11%,台积电跌超10%。
随着DeepSeek(深度求索)引发海内外空前的高度关注,春节期间,多位用户反馈,难以正常登录和使用DeepSeek,时常宕机。1月30日,澎湃新闻记者从网络安全公司奇安信获悉,针对DeepSeek线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。