一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
·DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。
来源:【河北经济日报】本报讯(长城网·冀云客户端记者李代姣 通讯员郭东)2月7日,长城新媒体集团正式完成对国内领先的人工智能大模型——深度求索DeepSeek的开发接入,通过DeepSeek与集团自研的长城大模型深度对接,相关能力已在该集团建设运营的河北省县级融媒体中心省级技术平
每经记者:陈植 每经编辑:马子卿DeepSeek对银行信贷等业务生态的变革日益显现。记者多方了解到,近日多家银行在接入DeepSeek并完成本地化部署后,正在测试DeepSeek在银行信贷业务场景的应用成效。
今年1月,深度求索(DeepSeek)公司发布通用大模型DeepSeek-R1,以其低成本、高性能的特征在全球引起巨大轰动。DeepSeek的出圈是我国AI发展的重要里程碑,为产业发展带来了一系列有益的启示。