【文/观察者网 陈思佳】这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果引发全球科技行业高度关注,西方媒体也发文感叹“中国AI模型震惊硅谷”。
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
DeepSeek开源之后,巨量的协作者涌入,技术边界的探索如火如荼。从长文本到图文等多模态的推理能力,在具身智能领域,谁有机会成为第一个吃DeepSeek螃蟹的人?2月6日,北京大学联合香港科技大学发布了多模态版DeepSeek-R1——Align-DS-V。