几乎与DeepSeek同时发布的,Kimi全新强化学习模型k1.5,虽然是全球继OpenAI之后首个多模态类o1模型,在诸多层面能力接近o1甚至是超越,但没有溅起多大水花,同样淹没在了DeepSeek狂热的舆论中。
梁文锋是横空出世的青年才俊,他创建的深度求索公司在极短的时间内推出DeepSeek-V3/R1两种大模型,以其性能卓越、开源普惠的特点很快便风行世界,将中国AGI推向世界顶端,有力地推动了技术发展和文明进程。
北京时间2月18日,在马斯克还在庆祝Grok 3模型正式发布的时候,DeepSeek官方在社交平台X上发布了一篇纯技术论文,主要是关于原生稀疏注意力,直指ChatGPT等顶尖大模型背后的Transformer架构最核心的注意力机制。
继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3和Stable Diffusion。
Deepseek创始人梁文锋大火,除了振奋人心的真实报道外,关于他的假新闻和谣言也不少,主要有如下几类:一、伪造公开言论与账号假冒网传梁文锋针对《黑神话悟空》制作人冯骥的公开评价作出回应,称其为“国运级成果”。辟谣:官方明确表示该回应为虚假信息,梁文锋未公开发表相关言论。
来源:环球时报 英国《经济学人》网站2月19日文章,深度求索背后是一所耀眼的中国大学 杭州最近发生一场技术革命。人工智能公司深度求索(DeepSeek)就是在杭州发展起来的,其亮相震惊外国竞争对手。该公司由梁文锋创立,他是浙江大学(浙大)的毕业生,这所大学在中国以外仍鲜为人知。
英国《金融时报》1月25日文章,原题:中国小型人工智能初创公司深度求索如何震惊硅谷 本周,中国一家人工智能(AI)实验室发布尖端模型的“技术配方”,此举不仅震惊世界,也使其低调的负责人变成无视美国阻止中国高科技雄心企图的民族英雄。
【事件聚焦】在“DeepSeek”的背后,有一所特别耀眼的中国大学。2 月 19 日,英国的《经济学人》用这个做题目发了文章说,以前,浙江大学在咱们中国以外的地方没多少人知道。可这些年,这所大学发展得特别快,到现在已经变成杭州一个研究者、企业家扎堆的创新生态系统的关键部分啦。
报道说,施密特日前在巴黎参加 AI 行动峰会时接受采访指出,目前除了 Meta 的 Llama 以外,美国大部分顶级 AI 大语言模型都是闭源的,包括谷歌的 Gemini、Anthropic 的 Claude 和 OpenAI 的 GPT-4。