中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象,并触发了本周一美国科技股“崩盘”。1月29日,OpenAI最新称,它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型,并暗示这可能违反了OpenAI的服务条款。
这个概念最早出现在2015年《Distilling the Knowledge in a Neural Network》论文里,作者是 Geoffrey Hinton、Oriol Vinyals 和 Jeff Dean。
它成功突破了多个开源大模型的性能瓶颈,在众多测试中表现出色,甚至超越了阿里自研的 Qwen2.5-72B 和 Meta 的 Llama 3.1-405B 等知名模型,与 OpenAI 的 GPT-4o、Anthropic 的 Claude 3.5-Sonnet 等闭源大模型相抗衡,展现出了强大的实力。
2月9日,DeepSeek-V3 API服务的45天优惠价格体验期已结束,从2月9日开始将调整为新的价格:每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。此前DeepSeek在优惠期内API价格为每百万输入tokens 0.
来源:环球网 【环球网科技综合报道】2月7日,钉钉 AI 助理现已全面接入 DeepSeek 系列模型,用户可自主选择 DeepSeek 系列的 R1(671B 满血版及 qwen32b 蒸馏版)、V3(671B 满血版)共 3 种模型。
仅是DeepSeek官方整理的“DeepSeek实用集成”名单,就有54款接入DeepSeek的应用,包括24个应用程序、3个AI Agent框架、1个RAG框架、1个Solana框架、3个即时通讯插件、8个浏览器插件、2个VS Code插件、3个neovim插件、2个JetBrains插件等。