DeepSeek给云计算厂商带来立竿见影的回报。“基本上把各家主要云厂商,包括运营商的云端算力库存清空了。”一家大模型研究机构的研究员对记者表示。这家机构调研国内云厂商后得出这一结论。1月20日,DeepSeek-R1大模型发布后,各家云计算厂商纷纷上线其满血版或者蒸馏版模型。
DeepSeek的后劲儿来了,算力需求暴增,“GPU不够用了”。当DeepSeek以557.6万美元的极低成本训练出性能匹敌GPT-4的V3模型,后又推出推理成本极低的R1模型时,市场的争议在于,AI算力需求是否会被效率革命替代?
齐鲁晚报·齐鲁壹点记者 张頔在农历龙年的最后几天,横空出世的DeepSeek如飞龙在天,给了全球科技界“亿点点”震撼。DeepSeek是量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。