1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
我认为,程序领域,1%的灵感吊打99%的汗水,码代码这种事,靠努力真没啥用,天赋决定一切,ds真是属于国运级灵光乍现,别国外AI,目前科技竞争,就中美,其他国家连陪跑都算不上,DS非常牛,从概率上跟于敏差不多,美国AI也很牛,目前算不上分胜负,毕竟英伟达还是统治算力,要是我们自主英伟达,那离天朝上邦就真不远了。
分享就到这里了,“感谢大家的陪伴与支持!未来,我们还会继续带来更多有趣、时新的消息和故事,陪你一起笑、一起聊、一起看世界的变化。如果你喜欢我们的内容,别忘了点赞、分享,或者留下你的想法——因为你们的支持,才是我们前进的最大动力!“下次见,更多精彩等你来发现!