1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
我认为,程序领域,1%的灵感吊打99%的汗水,码代码这种事,靠努力真没啥用,天赋决定一切,ds真是属于国运级灵光乍现,别国外AI,目前科技竞争,就中美,其他国家连陪跑都算不上,DS非常牛,从概率上跟于敏差不多,美国AI也很牛,目前算不上分胜负,毕竟英伟达还是统治算力,要是我们自主英伟达,那离天朝上邦就真不远了。
每经记者:朱成祥 每经编辑:杨夏近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。DeepSeek话题的火热,也带动其官方网页和App访问量的上升。
这几天各路博主吹嘘DeepSeek的风太猛!过了!过了!真的有点过了!什么改变世界了……什么即将替代80%的工作了……可把我整笑了。不至于!真的不至于!一个AI工具而已。从工业革命到现在,技术突飞猛进的时候多了。也没见到有谁因为技术发展,成为废人。
美国那边刚被曝出对中国一家人工智能公司下黑手,转头又搞安全审查,这操作把国内外网友都看傻了。有个在公司加班的技术员在网上吐槽:“当时报警器响得跟救护车似的,显示屏上的数字飙得比双十一成交额还快,这辈子没见过这么狠的网络攻击。”