1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
近日,美国政府宣布以芬太尼等问题为由对中国输美产品加征10%关税。由于近期DeepSeek火爆,因此我向Deep老师请教了一下美国对中国加征10%关税后,中国有哪些反制手段?同时,为了了解DeepSeek与ChatGPT之间的优劣对比,同样问题我也请教了Chat老师。
每经记者:王嘉琦 蔡鼎 宋欣悦 高涵 每经编辑:陈柯名,高涵,兰素英◆从1月20日推理模型DeepSeek-R1开源至今13天来,DeepSeek引起全球的惊讶,英伟达市值一周蒸发5520亿美元,硅谷巨头恐慌,华尔街焦虑。