1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
近日,AI界的DeepSeek可谓是“风波不断”。1月26日到28日期间,DeepSeek多次出现服务异常。先是26日出现局部服务波动,27日更是多次“宕机”,网页和API不可用、无法登录注册等问题频发,到28日又遭遇大规模恶意攻击。
【DeepSeek服务再次“宕机”】财联社1月27日电,27日晚,DeepSeek服务状态页面显示,DeepSeek网页不可用,公司正在调查这一问题。多位网友表示,DeepSeek崩了。实测发现,目前DeepSeek无法回答对话问题。
DeepSeek 注册限制事件回顾在科技飞速发展的当下,AI 领域的一举一动都备受瞩目。DeepSeek 作为行业内的佼佼者,其推出的一系列 AI 模型,凭借强大的性能和出色的表现,迅速在全球范围内吸引了大量用户,成为 AI 领域的焦点之一。
来源:【中国能源报】1月26日,有网友反应,DeepSeek崩了,提示服务器繁忙。DeepSeek今天下午回应称:今天下午(1月26日)DeepSeek确实出现了局部服务波动,但问题在数分钟内得到解决。此次事件可能与新模型发布后的访问量激增有关,而官方状态页未将其标记为事故。
1月27日,DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。昨日(26日),DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。
1月20日,该公司发布推理大模型DeepSeek-R1,仅用OpenAI十分之一的训练成本,实现了比肩甚至超越GPT-4o、Claude-3.5等顶尖闭源模型的性能,在数学、代码和自然语言推理等任务上表现卓越,且完全开源,支持免费商用。