它成功突破了多个开源大模型的性能瓶颈,在众多测试中表现出色,甚至超越了阿里自研的 Qwen2.5-72B 和 Meta 的 Llama 3.1-405B 等知名模型,与 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5-Sonnet 等闭源大模型相抗衡,展现出了强大的实力。
周鸿祎称,这两天美国对DeepSeek 痛下杀手,政府制裁、起诉,Openai公司也指责其从自家 GPT 里蒸馏能力,甚至美国政府据说要宣布蒸馏为非法。但蒸馏是人工智能训练普遍方法,是把大模型能力总结出来加强小模型。
文 | SE7EN_CHLOE随着春节前后数个大模型陆续发布,人工智能的网络热评已经从技术圈扩大到社会圈、朋友圈。国内外好评与差评,热捧与诋毁,在我看来都是浮云,它既不会影响DeepSeek自身的迭代,也不会掣肘同行探索脚步。