故事起因是这样的:10天前,大家都准备回家过年了,结果来自浙江的一家小公司DeepSeek火了,它发布的V3模型,震惊了美国AI圈和金融圈,还上了新闻联播,一夜之间和华为、阿里比肩齐名了,搞的扎克伯格一度呼吁美国加紧封锁中国AI技术。
周鸿祎称,这两天美国对DeepSeek 痛下杀手,政府制裁、起诉,Openai公司也指责其从自家 GPT 里蒸馏能力,甚至美国政府据说要宣布蒸馏为非法。但蒸馏是人工智能训练普遍方法,是把大模型能力总结出来加强小模型。