一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
来源:环球时报 【环球时报驻美国、德国特约记者 冯亚仁 青木 环球时报特约记者 柳玉鹏 文远】春节前夕,中国人工智能(AI)企业深度求索(DeepSeek)发布其开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1模型
来源:【闪电新闻】这个春节,由深度探索(DeepSeek)所带来的震撼与惊喜席卷全球。数据显示DeepSeek上线20天,日活突破了2000万。以“低成本、高性能”著称的DeepSeek,给各行业带来的影响正不断显现,迅速吸引了全球关注。