深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
川观智库研究员 李媛莉当全球科技巨头围绕“千亿参数大模型”展开竞赛时,来自中国的DeepSeek(深度求索)却以“低成本、高性能、全开源”的策略,成为搅动行业格局的颠覆者。DeepSeek是什么?究竟有哪些重大影响及意义?
但DeepSeeK这项设置, 令美国无法禁止。直接引爆了美国AI界大佬们恐慌,同时在周一盘前引发了几十只科技股暴跌之后,美东时间1月28日下午,美多名官员已经确认正对DeepSeek对美国家安全影响展开调查!
自2016年来,人工智能就成为新传研究非常重要的一个领域,这个领域我们都看过不知道多少论文,背过不知道多少的“喂饭材料”。然而,以后的喂饭材料可能又要变了,而且可能让机器人给你喂。这就是最近在社交媒体中刷屏,甚至在小红书之后冲上海外APP榜单第一名的Deepseek。
AI大模型领域动辄数亿甚至数十亿美元的硬件建设让绝大多数国家都望而却步,并且这还是初期的投入,随着大模型的不断迭代升级,硬件投资与开发投入将会高达数百亿甚至上千亿美元,如此巨额投入劝退了绝大部分国家,都放弃了自行开发的打算,准备订阅昂贵的OpenAI以及美国各大AI巨头开发的大模型。
前言相信这个春节大家都被deepseek刷屏了,写本篇文章是因为我经历过了各种付费+测试之后很艰难想入手大模型,国内的同学学技术还是太困难了,但是看到市面上各种火爆,实在有按捺不住想体验,终于迎来了一个契机。