近日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会。记者注意到,来自广东湛江的AI初创公司深度求索(DeepSeek)创始人梁文锋出席并发言。DeepSeek日前发布的大模型在国内外媒体刷屏,也引发全球科技圈、投资圈的关注。
1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克。数字生命卡兹克:努力分享一些很新、很酷的AI干货,愿我们永远对世界保持好奇。这两天,DeepSeek-R1火的飞起,在中日美三个Appstore榜上登顶。昨晚,还直接干崩英伟达,盘前先死13个点,连带着台积电一起。
一个来自中国的开源AI模型DeepSeek-V3,以更少的训练时间成本、更低的花费以及同样优越的性能,强烈震撼了全球的AI圈。开发这个模型的国内大模型公司DeepSeek(简称“深度求索”),成立于2023年7月,注册资本1000万元。