原标题: 响应“东数西算”战略:亿算智能推动首个国产万卡推理集群支持DeepSeek 671B全量部署,构建国产算力与大模型融合新生态 DeepSeek作为国产大模型领域的破局者,凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」,在保证推理精度的同时,将训练能耗降低至
每经记者:叶晓丹 每经编辑:梁枭从被质疑到被认可,乃至一度掀翻美国科技股股价,DeepSeek成了春节期间的一匹AI创新黑马,热度绵延至今。同样火爆的还有宇树科技,春晚舞台上《秧Bot》宇树机器人从列阵到肢体协调度,从运动控制到转手绢,无不让人拍手叫绝。
近日一股来自东方的“神秘力量”——国产AI大模型DeepSeek以现象级速度横扫全球科技圈开始硬控全球网友DeepSeek以极低的训练成本实现了与全球顶尖模型相媲美的性能它就像是一个聪明又懂你的助手被中外网友玩出了花样小编体验过DeepSeek之后只想感叹这也太才华横溢了吧(继续
一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
·DeepSeek同时考虑算法精度和系统效率。除了极致的底层优化,协同优化也可能让大模型在利用国产算力时达到甚至超越英伟达GPU的性能。从最顶层的产品应用到底层的基础设施,大模型的每一个层级都已经形成了非常好的生态,每一个层级上都存在着优化空间。
此前,英伟达及亚洲部分AI半导体相关股票承压,美国科技巨头也开始遭遇投资者的质疑,巨大的AI投入是否与回报相匹配,另一边,中国DeepSeek相关主题不断飙升,恒生指数过去一个月累计上涨15%,是同期全球主要指数中表现最好的,上周走势也领涨全球。
这个国内原生的大模型锋芒剑指OpenAI、谷歌等全球科技巨头,甚至凭一己之力影响了使得美股AI龙头普遍重挫——曾被认为AI生态中不可替代一环的NVIDIA股价甚至在1月27日当日暴跌17%,至1月31日,NVIDIA市值在一周内缩水4000亿美元。