1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
【云天励飞:公司Deep Edge系列推理卡已经适配云天天书、通义千问等主流大模型】财联社11月25日电, 云天励飞在特定对象调研中表示,公司Deep Edge系列推理卡已经适配了包括云天天书、通义千问、百川智能、以及Llama2/3等在内的近十个主流大模型,可实现性能更强的轻量