似乎一夜之间,DeepSeek(深度求索)就“火”了。其实早些时候,这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑,近日由于其最新开源了推理模型R1正式版,不仅登顶苹果美国地区应用商店免费APP下载排行榜,在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。
近期,许多用户发现,中国初创公司深度求索在苹果应用商店上架了自己的大模型应用“DeepSeek”,其下方评论中就有网友表示,用了一年的网页端,终于等到了App。 该App的商店页面显示,这是DeepSeek官方推出的AI助手,可“免费体验与全球领先AI模型的互动交流”。
前言相信这个春节大家都被deepseek刷屏了,写本篇文章是因为我经历过了各种付费+测试之后很艰难想入手大模型,国内的同学学技术还是太困难了,但是看到市面上各种火爆,实在有按捺不住想体验,终于迎来了一个契机。
本报记者 吴清 北京报道近日,一家来自中国的公司Deepseek在全球AI界刷屏,其最新推出的大模型DeepSeek-V3,迅速在AI行业内引发广泛关注和热议,主要原因就是预训练成本之低,其训练同样性能的大模型成本仅是行业主流的十分之一左右。
国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
就在2024年12月26日,国产大模型DeepSeek V3的发布在国际AI圈投下一个重磅深水炸弹,引入瞩目。为什么会得到这么大的刷屏关注度,一起来看这个国产AI大模型DeepSeek的厉害之处,在一众国内外的AI中到底亮眼之处在哪里。